ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 



PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MATIERE DE BREVETS (PCT) 



(51) Classification 

C12N 15/31, C07K 14/22, 16/12, A61K 
39/095, C12Q 1/68, G01N 33/53 



(ID 
(43) Date de 



WO 98/02547 

22janvier 1998 (22.01.98) 



(22) Date de depdt international: 



nale: PCT/FR97/01295 
11 juillet 1997(11.07.97) 



(30) Donnees relatives a la priority: 

96/08768 12 juillet 1996 (12.07.96) 



(71) Deposants (pour tous les Etats disignis sauf US): IN- 

STTTUT NATIONAL DE LA SANTE ET DE LA 
RECHERCHE MEDICALE (INSERM) [FR/FR]; 101, 
rue de Tolbiac, F-75654 Paris Cedex 13 (FR). MAX- 
PLANCK-GESELLSCHAFT ZUR F6RDERUNG DER 
WISSENSCHAFTEN E.V., BERLIN [DE/DE]; Hof- 
gartenstrasse 2, D-80539 MUnich (DE). SMTTHKLINE 
BEECHAM [GB/GB]; New Horizons Court, Brentford 
TW8 9EP (GB). 

(72) Inventeurs; et 

(75) Inventeurs/De'posants (US settlement): NASSIF, Xavier 
[FR/FR]; 30, rue Labrouste, F-75015 Paris (FR). TINS- 
LEY, Colin [FR/FR]; 156, rue de Vaugirard, F-75015 Paris 
(FR). ACHTMAN, Mark [DE/DE]; Neuenburgerstrasse 
16, D-10969 Berlin (DE). RUELLE, Jean-Louis [BE/BE]; 
Residence de la Lyre 18. B-1300 Limal (BE). VINALS, 
Carta [BE/BE]; Rue des Acacias 30, B-4000 Liege (BE). 



MERKER, Petra [DE/DE]; Cuvrystrasse 38, D-10997 
Berlin (DE). 



(74) Mandatalres: PEAUCELLE, Chantal etc.; Cabinet Armengaud 
Aine\ 3, avenue Bugeaud, F-75116 Paris (FR). 



(81) Etats designes: AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, 
CA, CH, CN, CU, CZ, DE, DK, EE, ES. FI, GB, GE, GH, 
HU, IL, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, 
LT, LU, LV, MD, MG, MK, MN, MW, MX, NO, NZ, PL, 
PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, 
UA, UG, US, UZ, VN, YU, ZW, brevet ARIPO (GH, KE, 
LS, MW, SD, SZ, UG, ZW), brevet eurasien (AM, AZ, BY, 
KG, KZ, MD, RU, TJ, TM), brevet europeen (AT, BE, CH, 
DE, DK, ES, FI. FR, GB. GR. IE, IT, LU, MC, NL, PT, 
SE), brevet OAPI (BF, BJ, CF, CG, CI, CM, GA, GN, ML, 
MR, NE, SN, TO, TO). 



Sans rapport de recherche internationale, sera republiSe dis 
riception de ce rapport. 



(54) Title: DNA AND SPECIFIC PROTEINS OR PEPTIDES OF THE NEISSERIA MENINGITIDIS SPECIES BACTERIA, METHOD 
FOR OBTAINING THEM AND THEIR BIOLOGICAL APPLICATIONS 

(54) Tltre: ADN ET PROTEINES OU PEPTIDES SPECIFIQUES DES B ACTERIES DE L'ESPECE NEISSERIA MENINGITIDIS, LEURS 
PROCEDES D'OBTENTION ET LEURS APPLICATIONS BIOLOGIQUES 



(57) Abstract 

The DNA of the invention are characterised in that they concern the whole or part of genes, with their reading frame, to be found 
in Neisseria meningitidis, but not in Neisseria gonorrhoeae, or in Neisseria lactamica except the genes involved in the biosynthesis of 
the polysaccharide capsule, frpA, frpC, opc, pork, rotamase the sequence IC1106, IgA protease, pilline, pilC, transferrin binding proteins 
and opacity proteins. The invention also concerns the polypeptides corresponding to these DNA and the antibodies directed against these 
polypeptides. It is applicable in the prevention and the detection of meningococcus induced infections and meningitis. 

(57) Abrege- 

Les ADN de l'invention sont caractens6s en ce qu'il s'agit de tout ou partie de genes, avec leur phase de lecture, presents chez 
Neisseria meningitidis, mais absents soit chez Neisseria gonorrhoeae, soit chez Neisseria lactamica a ^exception des genes impliquds dans 
la biosynthese de la capsule polysaccharidique,.fo>A. frpC, opc, pork, rotamase, de la sequence ICU06, des IgA 0101*8868, de la pilline, 
de pilC, des prot6ines qui lient la transferrine et des prolines d'opacitC. L'invention vise egalement les polypeptides correspondant a ces 
ADN et les anticorps diriges contre ces polypeptides. Applications a la prevention et a la detection defections a meningocoques et de 
mdningites. 
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ADN et proteines ou peptides specifiques des 
bacteries de l'espece Neisseria meningitidis, leurs 
procedes d'obtention et leurs applications biologiques. 

5 L' invention est relative aux ADN, et aux proteines 

et peptides, specifiques des bacteries de l'espece 
Neisseria meningitidis (ci-apres en abrege Nm), a leur 
procede d'obtention et a leurs applications biologiques, 
en particulier pour la prevention et la detection 

10 d' infections a meningocoques et de meningites. 

On sait que Nm constitue 1 ' un des principaux agents 
de la meningite cerebrospinal. 

Des etudes menees aux Etats-Unis ont montre que de 5 
a 10% de la population sont porteurs asymptomatiques de 

15 souche(s) de Nm. Les facteurs de transmission de Nm sont 
mal connus. Pour une proportion des personnes infectees, 
Nm penetre le flux sanguin, ou elle peut provoquer une 
meningococcemie et/ou progresse dans le flux 
cerebrospinal pour provoquer une meningite. Sans 

20 traitement antibiotique rapide, 1' infect ion peut se 
developper de maniere fulgurante et devenir mortelle. 

Comparee aux autres pathogenes, Nm presente la 
caracteristique de pouvoir franchir la barriere hemato- 
encephalique afin de coloniser les meninges. L' etude de 

25 la pathogenicity de Nm est done non seulement importante 
dans le cadre de la meningite, raais aussi dans le cadre 
de toute maladie touchant le cerveau. 

On concoit alors 1 ' interet de disposer d 1 outils 
specifiques de cette espece bacterienne pour les 

30 applications envisagees ci-dessus. 

Nm est genetiquement tres proche des bacteries de 
l'espece Neisseria gonorrhoeae (ci-apres en abrege Ng) et 
de l'espece Neisseria lactamica (ci-apres en abrege Nl ) . 
Leur pathogenicity est toutefois tres differente. 
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Nm colonise le nasopharynx, puis traverse 
1' epithelium pharynge pour envahir 1 ' espace sous- 
muqueux, etant alors responsable de septicemie et de 
meningite. 

Ng est surtout responsable d' infections localisees 
du tractus genito-urinaire. Elle colonise la muqueuse 
genitale, puis traverse 1 ' epithelium, envahit ensuite le 
sous-epithelium ou elle se multiplie et est responsable 
d'une forte reaction inflammatoire. Des infections 
gonococciques disseminees sont possibles, mais restent 
rares et sont le fait de seulement certaines souches. 
Quant a Nl, on considere qu'il s ' agit d'une souche non 
pathogene, etant donne qu'elle n'est pas responsable 
d' invasion localisee ou generale. 

Ainsi, une premiere consideration amene a prendre en 
compte le fait que Nm et Ng , tout en etant des bacteries 
tres proches, presentent des pouvoirs pathogenes 
dif f erents . 

Le genome de ces bacteries etant fortement 
homologue, seules des parties limitees du genome de Nm et 
de Ng doivent coder pour des facteurs de virulence 
specif iques, responsables de leur pathogenese. 

II est clair que Nm presente par rapport a Ng des 
sequences d'ADN qui lui sont specif iques et qui doivent 
intervenir au niveau de 1' expression de son pouvoir 
pathogene specif ique. 

L'espece Nm est subdivisee en serogroupes bases sur 
la nature des polysaccharides capsulaires. 

Au moins 13 serogroupes ont ete definis, parmi 
lesquels les serogroupes A, B et C sont responsables 
d' environ 90% des cas de meningites. Les groupes A et C 
sont observes dans les formes epidemiques de la maladie. 
Le groupe B est le serogroupe le plus couramraent isole en 
Europe et aux Etats-Unis. 
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La capsule, presente chez Nm et absente chez Ng, a 
servi de base pour 1 ' elaboration de vaccins anti- 
meningite meningococcique. 

Les polysaccharides de la capsule de Nm ont ete 
5 utilises pour 1 ' elaboration d'un vaccin qui s'est montre 
efficace pour prevenir chez les adultes la meningite 
provoquee par les meningocoques de serogroupes A, C, W135 
et Y. 

Cependant, le polysaccharide de Nm groupe C s'est 

10 revele faiblement immunogene chez les enfants de moins de 
deux ans, alors que le polysaccharide de Nm groupe B est 
non immunogene chez 1 ' homme et partage des epitopes avec 
des glycoproteines d 1 adhesion presentes dans les cellules 
neuronales humaines. 

15 II n'existe done pas de vaccin universel capable de 

prevenir les infections provoquees par 1 ' ensemble des 
serogroupes des meningocoques et capable de repondre a la 
variability antigenique propre aux pathogenes bacteriens 
en general et a Nm en particulier. 

20 En raison de la reactivite croisee du polysaccharide 

groupe B de Nm avec les antigenes humain, de la 
multiplicity des serogroupes et de la variability 
antigenique de Nm, les strategies proposees a ce jour ne 
peuvent conduire a un vaccin efficace dans toutes les 

25 situations. 

Les recherches se sont alors concentrees sur 1 ' etude 
d' elements caracteristiques responsables de la 
specif icite de la pathogenese meningococcique. 

La plupart des genes qui ont ete etudies dans l'une 

30 quelconque des deux bacteries Nm ou Ng possedent leur 
homologue dans la deuxieme bacterie. 

De la meme maniere, la plupart des facteurs de 
virulence jusqu'ici identifies dans Nm ont une 
contrepartie dans Ng, e'est-a-dire la piline, les 
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proteines Pile, les proteines d'opacite et les recepteurs 
de la lactoferrine et de la transferrine. 

Les attributs specif iques des meningocoques 
caracterises dans 1 ' art anterieur sont la capsule, les 
proteines Frp analogues aux toxines RTX, les proteines de 
la membre externe Opc, la peroxydase glutathione, la 
porine PorA et le gene rotamase. 

Parmi ceux-ci, seule la capsule est invariablement 
presente dans les souches virulentes de Nm. Cependant, de 
nombreux pathogenes extra-cellulaires possedent une 
capsule sans pour autant traverser la barriere hemato- 
encephalique. 

Des attributs non encore identifies doivent done 
etre responsables de la specificite de la pathogenese 
meningococcal. Ces attributs sont vraisemblablement 
codes par des sequences d'ADN presentes parmi les 
meningocoques mais absentes chez les gonocoques. 

Les inventeurs ont developpe une nouvelle voie 
d'approche basee sur l'isolement soustractif des genes 
Nm- specif iques, ces genes devant etre lies a la 
pathogenese specifique de Nm, et, plus particulierement 
au franchissement de la barriere hemato-encephalique. 

La methode soustractive developpee dans l'art 
anterieur a abouti a la production de marqueurs 
epidemologiques pour certains isolats de Nm. Ces 
marqueurs sont d'une utilite limitee : ils ne couvrent 
pas 1' ensemble des serogroupes de l'espece Nm. 

Par contraste avec ces etudes, les travaux des 
inventeurs ont conduit, en confrontant Nm a 1' ensemble du 
chromosome de Ng, cisaille de maniere aleatoire, a la 
mise au point de moyens pour doner 1' ensemble des ADN 
presents chez Nm et absents chez Ng, fournissant ainsi 
des outils de haute specificite vis-a-vis de Nm et 
permettant ainsi de repondre pour la premiere fois a la 
variabilite genetique de l'espece. 
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Les termes "present" et "absent", tel qu' utilises 
dans la description et les revendications en rapport avec 
les ADN d'une souche, ou leurs produits d ' expression, 
sont apprecies par rapport a des conditions d ' hybridation 
5 identiques ( 16h a 65 'C, avec NaP0< 0,5M, pH 7,2; EDTA-Na 
0,001M, 1%,1% d'albumine de serum bovin et 7% de 
dodecylsulfate de sodium), en utilisant une meme sonde et 
une meme intensite de marquage de la sonde, une meme 
quantite d * ADN chromosomique et un meme element de 

10 comparaison (ADN chromosomique de la souche homologue). 
Ainsi, on considere que l'ADN est present lorsque le 
signal obtenu avec la sonde est pratiquement le meme que 
celui obtenu avec la souche de reference. 

En revanche, on considere que l'ADN est absent 

15 lorsque ce signal apparait tres faible. 

Une deuxieme consideration sur les pathogenicity de 
Nm et de Ng conduit a prendre en compte leur aptitude 
commune a coloniser et a penetrer la muqueuse puis a 
envahir l'espace sous-epithelial de cette derniere. II 

20 est fort vraissemblable que ce processus implique des 
facteurs de virulence communs aux deux pathogenes. A cet 
egard, on sait qu'un certain nombre de facteurs de 
virulence ont ete deja identifies chez Nm et chez Ng, 
comme les proteines pili, PilC, les proteines d'opacite, 

25 les proteases d'IgA, les proteines de liaison a la 
transferrine et a la lactoferrine, et des 
lipooligosaccharides . 

La demarche des inventeurs s'est done etendue a la 
recherche de regions de Nm, specif iques de Nm et de Ng, 

30 mais absentes chez 1 1 espece non pathogene Nl, et d'une 
maniere generale a la recherche, par les moyens mis au 
point conformement a 1' invention, de regions 
chromosomiques d'ADN et de leurs produits d ' expression, 
specif iques d'une espece donnee. 
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L ' invention a done pour but de fournir des ADN de Nm 
specif iques de son pouvoir pathogene et des moyens pour 
les obtenir, notamment en elaborant des banques formees 
exclusivement de ces ADN Nm- specif iques. 
5 Elle vise egalement les produits derives de ces 

sequences d'ADN. 

L' invention vise egalement la mise a profit des 
caracteres specif ique et exhaust if de ces banques pour 
elaborer des outils utilisables notamment en diagnostic, 
10 therapie et prevention. 

Les ADN de 1 ' invention sont caracterises en ce qu ' il 
s'agit de tout ou partie de genes, avec leur phase de 
lecture, presents chez Neisseria meningitidis, mais 
absents soit chez Neisseria gonorrhoeae, soit chez 
15 Neisseria lactamica, a 1' exception des genes impliques 
dans la biosynthese de la capsule polysaccharidique, 
frpA, frpC, opc, por A, rotamase, de la sequence IS1106, 
des IgA proteases, de la pilline, de pile, des proteines 
qui lient la transferrine et des proteines d'opacite. 
20 Comme precise plus haut, les termes "presents" et 

' ' absents ' ' sont apprecies par rapport aux conditions 
d ' hybridation telles qu'utilisees dans les Southern blots 
decrits dans les exemples et rappelees plus haut. 

On notera que ces ADN englobent les variants des 
25 lors qu'ils expriment une fonction propre a l'espece Nm, 
plus particulierement un phenotype retrouve uniquement 
chez Nm ou en commun exclusivement avec Ng. 

Selon un aspect majeur, ces ADN sont specif iques de 
la pathogenecite de Neisseria meningitidis et ce, en 
30 depit de la variability genetique de cette espece. 

Selon un mode de realisation de 1' invention, lesdits 
ADN sont specif iques de Nm par rapport a Ng. 

Plus particulierement, les ADN Nm-specif iques sont 
absents de Neisseria lactamica et de Neisseria cinerea. 
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De facon surprenante, la majorite des differences 
genetiques entre les souches de meningocoques et celles 
de gonocoques apparaissent regroupees en regions 
distinctes, qui correspondraient a des ildts de 
5 pathogenecites comme precedemment decrit pour E. coll et 
Y . pestls. 

Ainsi, dans une disposition preferee de 1' invention, 
ces ADN sont egalement caracterises en ce qu 1 ils 
comprennent une ou plusieurs sequence(s), telle(s) que 

10 presente(s) sur le chromosome de Neisseria meningitidis 
Z2491 entre tufA et pilT, ou region 1 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s'hybrider avec 
la ou les sequence(s) ci-dessus, sous reserve d'etre 
specif ique( s ) de Neisseria meningitidis. 

15 Par "specifique" , on designe dans la description et 

les revendications les sequences de nucleotides qui ne 
s'hybrident qu'avec celles de Nm, dans des conditions 
d ' hybridation donnees dans les exemples et rappelees plus 
haut . 

20 on notera a cet egard que, de maniere generale, 

lorsqu'on fait reference dans la description et les 
revendications a "tout ou partie" d'une sequence, cette 
expression doit etre appreciee par rapport a la 
specif icite definie ci-dessus. 

25 De meme, tout ou partie d'un peptide, ou un fragment 

d'un peptide ou d'un anticorps designe un produit 
presentant les proprietes biologiques respectivement du 
peptide natif ou de 1' anticorps forme contre le peptide. 
Dans la region 1, sont regroupes des genes de la 

30 capsule de Neisseria meningitidis. 

Des ADN de ce type presentent une sequence 
correspondant , pour tout ou partie, a SEQ ID N*9, 13, 22 
ou 30, et/ou a toute sequence se situant a plus ou moins 
20 kb de ces SEQ ID sur le chromosome d'une souche de Nm, 

35 et/ou presentent une sequence capable de s'hybrider avec 
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au moins un fragment de 1 1 une quelconque de ces 
sequences. 

Dans une autre disposition preferee de 1' invention, 
ces ADN sont egalement caracterises en ce qu'ils sont 
5 constitues par une ou plusieurs sequence(s), telle(s) que 
presente(s) sur le chromosome de Neisseria meningitidis 
Z2491 entre pilQ et A740, ou region 2 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s'hybrider 
avec la ou les sequence(s) ci-dessus, sous reserve d'etre 
10 specifique(s) de Neisseria meningitidis. 

Des ADN selon cette disposition presentent une 
sequence correspondant , pour tout ou partie, a SEQ ID 
N*l, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou a toute sequence 
se situant a plus ou moins 20 kb de ces SEQ ID sur le 
15 chromosome d ' une souche de Nm, et/ou presentent une 
sequence capable de s'hybrider avec au moins un fragment 
de 1 ' une quelconque de ces sequences . 

L* invention vise tout specialement tout ou partie de 
la sequence d'ADN SEQ ID N'36 de 15620 pb, et les 
20 sequences correspondant aux cadres ouverts de lecture SEQ 
ID N'37, SEQ ID N* 38, SEQ ID N* 39, SEQ ID N* 40, SEQ ID 
N' 41, SEQ ID N* 42, SEQ ID N* 43, SEQ ID N* 44 et 
SEQ ID N* 45. 

Dans encore une autre disposition preferee de 
25 1' invention, ces ADN sont egalement caracterises en ce 
qu'ils sont constitues par une ou plusieurs sequence(s), 
telle(s) que presente(s) sur le chromosome de Neisseria 
meningitidis Z2491 entre argF et opaB, ou region 3 du 
chromosome, et/ou la ou les sequence(s) capable(s) de 
30 s'hybrider avec la ou les sequence(s) ci-dessus, sous 
reserve d'etre specif ique( s ) de Neisseria meningitidis. 

Des ADN selon cette disposition sont caracterises en 
ce qu'ils presentent une sequence correspondant pour tout 
ou partie a SEQ ID N'8, 21, 23, 25, 26, 28, 29, 32 ou 35, 
35 et/ou a toute sequence se situant a plus ou moins 20 kb 
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de ces SEQ ID sur le chromosome d ' une souche de Nm, 
et/ou, presentent une sequence capable de s ' hybrider avec 
au moins un fragment de l'une quelconque de ces 
sequences. 

5 Les regions 1, 2, 3, identif iees ci-dessus, 

presentent une forte proportion de sequences Neisseria 
meningitidis specif iques, et entrent egalement dans le 
cadre de 1' invention. 

D'autres ADN representatif s de la specif icite vis-a- 

10 vis de Neisseria meningitidis presentent une ou plusieurs 
sequences telle(s) que presente(s) sur le chromosome de 
Neisseria meningitidis Z2491, mais ne font pas partie des 
regions 1, 2, 3 definies ci-dessus. 

De tels ADN comprennent une ou plusieurs sequences 

15 correspondant pour tout ou partie a SEQ ID n*3, 5, 11, 
12, 14, 16, 18, 19, 20, 24, 27 ou 33, et/ou a toute 
sequence se situant a plus ou moins 20 kb de ces SEQ ID 
sur le chromosome d'une souche de Nm, et/ou presentent 
une sequence capable de s' hybrider avec de telles 

20 sequences. 

Compte tenu des applications particulierement 
visees, 1' invention concerne plus specialement les ADN 
ci-dessus impliques dans la pathogenese de l'organisme 
bacterien. 

25 Elle vise, en particulier, les ADN repondant a au 

moins l'une des caracterisations donnees ci-dessus, et 
codant pour une proteine exportee au-dela de la membrane 
cytoplasmique et/ou dont tout ou partie de leur sequence 
correspond a la region conservee desdits ADN. 

30 Ainsi, selon un autre mode de realisation de 

1' invention, les ADN sont communs avec ceux de Ng, mais 
sont absents de chez Nl. 

II s'agit plus specialement d'ADN presents sur la 
region 4 (arg J a reg F) ou sur la region 5 (marqueur 

35 lambda 375 a pen A) sur le chromosome de Nm Z2491 et/ou 
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capables de s'hybrider avec lesdits ADN presents, sous 
reserve d'etre specif iques de Nm et de Ng par rapport a 
Nl. 

Par " specif ique de Nm et de Ng par rapport a Nl", 
5 on designe des ADN qui s'hybrident avec les ADN de Nm et 
de Ng dans les conditions d ' hybridation des exemples 
(voir en particulier l'exemple 4). 

Les ADN des regions 4 et 5, et ceux capables de 
s'hybrider avec ces ADN, sous reserve d'exprimer les 
10 fonctions propres a Nm, presentent 1 ' avantage 
d'intervenir de maniere majeure dans la virulence de Nm, 
en etant impliques dans l'etape de colonisation et de 
penetration initiales et dans la dissemination 

septicemique. 

15 Selon d'autres dispositions, 1* invention vise les 

vecteurs de trans fert et d' expression, tels que 
plasmides, cosmides ou bacteriophages, comportant au 
moins un ADN tel que defini ci-dessus. 

Elle vise aussi les cellules hotes telles que 

20 transformees par au moins un ADN tel que defini ci- 
dessus. 

D'autres cellules hotes de 1' invention comportent 
des genes ou des fragments de genes specifiques de Nm et 
sont caracterisees en ce que leur chromosome est delete 
25 d'au moins un ADN selon 1' invention, en particulier d'un 
ADN responsable de la pathogenicity. II s'agit plus 
specialement de cellules bacteriennes , notamment de Nm. 

L' invention a egalement pour objet les ARN dont la 
sequence correspond pour tout ou partie a la 
30 transcription d'au moins une sequence ou fragment de 
sequence d'ADN tel que defini ci-dessus. 

Les acides nucleiques anti-sens des ADN tels que 
definis ci-dessus, ou de fragments de ces ADN, font 
egalement partie de 1' invention. 
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Ces acides nucleiques anti-sens portent le cas 
echeant au rnoins un substituant telle qu'un groupe 
methyle et/ou un groupe glycosyle. 

D ' autres produits entrant dans le champ de 
5 1 ' invention sont constitues par des polypeptides . 

Ces polypeptides sont caracterises en ce qu ' ils 
presentent un enchainement d ' acides amines correspondent 
a tout ou partie d'une sequence telle que codee par les 
acides nucleiques definis dans ce qui precede, ou telle 
10 que deduite des sequences de ces acides nucleiques. 

II s'agit avantageusement de polypeptides 
correspondant a tout ou partie de polypeptides exportes 
au-dela de la membrane cytoplasmique, plus specialement 
de polypeptides correspondant a tout ou partie de ceux 
15 tels que codes par une region conservee. 

En variante, les polypeptides de 1' invention peuvent 
etre modifies par rapport a ceux correspondant aux 
sequences d' acides nucleiques, et ce de maniere a etre 
particulierement adaptes pour une application donnee, en 
20 particulier une application vaccinale. 

Par modification, on entend toute alteration, 
deletion, substitution chimique, des lors qu'elle 
n'affecte pas les proprietes biochimiques des 
polypeptides natifs correspondants, plus specialement des 
25 proteines fonctionnelles telles qu'exportees au niveau du 
periplasme et de la membrane externe. 

D ' autres produits conf ormes a 1 ' invention sont 
constitues par les anticorps diriges contre les 
polypeptides ci-dessus. 
30 L' invention vise ainsi les anticorps polyclonaux, 

ainsi que les anticorps monoclonaux, caracterises en ce 
qu ' ils reconnaissent au moins un epitope d ' un polypeptide 
tel qu'evoque plus haut. 

Elle vise egalement les fragments de ces anticorps, 
35 plus particulierement les fragments Fv, Fab, Fab' 2. 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 



12 



PCT/FR97/01295 



Les anti-anticorps capables de reconnaitre les 
anticorps definis ci-dessus, ou leurs fragments, selon 
une reaction de type antigene-anticorps, font egalement 
partie de 1' invention. 

Conformement a 1' invention, les differents produits 
consideres ci-dessus sont obtenus par voie de synthese 
et/ou biologique en operant selon les techniques 
classiques. 

Les acides nucleiques peuvent etre egalement obtenus 
a partir de banques constitutes d'ADN Nm- specif iques, 
telles qu'elaborees selon une technique soustractive, 
cette technique comprenant : 

- le melange de deux populations d'ADN, 

- la realisation d ' au moins une iteration 
d' hybridation-amplification soustractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas echeant de leur purification avec 
1 ' elimination des sequences redondantes. 

Conformement a 1' invention, les deux 
populations d'ADN proviennent respectivement d'une souche 
de Neisseria meningitidis, dite souche de reference, pour 
laquelle la banque specif ique doit etre constitute, et 
d'une souche de Neisseria, dite souche de soustraction, 
presentant une homologie en sequences primaires d'ADN 
superieure a environ 70% avec la souche de Neisseria 
meningitidis, les sequences d'ADN des souches de 
soustraction et de reference etant telles qu'obtenues 
respectivement par cisaillement aleatoire, et par clivage 
par une endonuclease de restriction capable de produire 
des fragments de taille inferieure a environ lkb. 

L ' invention vise en particulier un procede 
d'obtention de banques d'ADN Neisseria meningitidis 
specif iques, comportant les etapes de : 

- cisaillement aleatoire de l'ADN chromosomique 
d'une souche Neisseria gonorrhoeae, dite souche de 
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sous traction, notamment par passages repetes a travers 
une seringue, 

- clivage de l'ADN chromosomique d'une souche 
de Neisseria meningitidis, dite souche de reference, de 
preference par une enzyme de restriction produisant des 
fragments de taille inferieure a lkb environ, 

- ligature des fragments d'ADN de la souche de 
reference, clives par 1' enzyme de restriction, avec des 
amorces oligonucleotidiques appropriees, 

- realisation d'une iteration d ' hybridation- 
amplification soustractive par : 

. melange des deux populations d'ADN dans des 
conditions appropriees pour 1 * hybridation des sequences 
homologues, puis 

. amplification des fragments auto-reanneles et 
recuperation de ces fragments, 

. digestion de ces fragments par une enzyme de 
restriction, et re-ligature a des amorces 
oligonucleotides suivie d'une 

- purification de l'ADN ligature, et le cas 
echeant, d'une nouvelle iteration d ' hybridation 
soustractive, comportant le melange de fragments d'ADN de 
Neisseria gonorrhoeae cisaille comme indique ci-dessus 
avec les fragments d'ADN de Neisseria meningitidis issus 
de 1' iteration precedente, suivi, si on le souhaite du 
clonage des ADN de la banque. 

Les amorces utilisees sont des amorces 
oligodesoxynucleotidiques adaptees a 1 ' endonuclease de 
restriction utilisee et permettant une insertion dans un 
site de clonage, tel que le site EcoRI du plasmide 
pBluescript. On choisira avantageusement de telles 
amorces parmi les oligodesoxynucleotides references dans 
le listing de sequence sous SEQ ID n'36 a 45. 
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Les banques ainsi obtenues sont formees d'ADN 
specifiques des meningocoques et absents chez les 
gonocoques . 

La specif icite des ADN a ete verifiee comme expose 
dans les exemples, a chaque iteration par Southern blots, 
avec des genes communs a la souche de soustraction et a 
la souche de reference, ou avec 1'ADN total de chacune 
des souches digere par une endonuclease de restriction, 
telle que Clal. 

A chaque iteration, a egalement ete verifiee 
l'exhaustivite de la banque d'ADN par Southern blotting 
avec des sondes connues pour etre specifiques de la 
souche de reference, a savoir pour Neisseria 
meningitidis, les genes frp, opc, rotamase, notamment. 

Les experiences realisees ont montre que les banques 
obtenues selon le procede de 1 ' invention sont depourvues 
des genes presentant une homologie significative avec des 
especes de Neisseria autre que Neisseria meningitidis, 
par exemple les genes, ppk ou pilCl, et ce generalement, 
en seulement 2 ou 3 iterations. 

Si necessaire, deux voies, non exclusives l'une de 
1 ' autre , peuvent etre empruntees . 

II est possible de proceder a une (n+l) eme 
iteration, en utilisant 1'ADN de 1' iteration n comme 
population d'ADN de la souche de reference. 

En variante, on realise une deuxieme banque, 
independante de la premiere, avec une enzyme de 
restriction de specif icite dif f erente de celle utilisee 
dans la premiere banque, par exemple Mbol. 

Dans tous les cas, il est preferable de conserver 
chacun des produits issus de chacune des iterations 
realisees. 

L' invention vise egalement 1 'utilisation de la 
technique soustractive decrite ci-dessus pour obtenir des 
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banques d'ADN communs entre Nm et Ng, mais specif iques 
par rapport a Nl. 

On constitue avantageusement trois banques 
differentes, dont deux par digestion de I'ADN 
5 chromosoraique de Nm par Mbol et Tsp5091, et la 
troisieme , par digestion de l'ADN chromosomique de Nm 
avec Mspl . Deux series de soustraction permettent de 
recuperer des ADN presentant la specificite recherchee, 
comme decrit dans les exemples. 

10 Le procede d'obtention de ces banques et les banques 

elles-memes font egalement partie de 1' invention. 

On observera que, de maniere generale, le procede de 
1 1 invention est applicable pour l'obtention de banques 
d'ADN specif iques d'une espece de cellule donnee ou d'un 

15 variant donne d'une meme espece, des lors qu'il existe 
une autre espece ou un autre variant proche genomiquement 
et exprimant des pouvoirs pathogenes differents. 

En appliquant le procede de 1' invention, on 
constituera avantageusement des banques d'ADN specif iques 

20 d'especes donnees de cryptocoques , d' Haemophilus, de 
pneumocoques ou encore d' Escherichia coll, ou plus 
generalement de tout agent bacterien appartenant a la 
meme espece et disposant de pathovars differents. 

De meme, a partir de ces banques, 1' invention 

25 fournit les moyens de disposer de facteurs de virulence 
specif iques d'une espece ou d'un variant donne. 

De telles banques constituent done des outils 
presentant un interet majeur pour disposer d'attributs 
responsables de la specificite d'un pathogene, cette 

30 application etant plus specialement illustree 
conformement a 1' invention par l'obtention de banques 
renfermant les attributs responsables de la specificite 
de la pathogenese meningococcique. 

L' etude des produits de 1' invention, acides 

35 nucleiques, polypeptides et anticorps, a permis de mettre 
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en evidence une specificite absolue vis-a-vis de 
Neisseria meningitidis, quelle que soit la souche et sa 
variability. 

Ces produits sont done particulierement appropries 
pour le diagnostic ou la prevention des infections et 
meningites provoquees par Neisseria meningitidis, que ce 
soit chez l'adulte ou l» enfant et quel que soit le 
serogroupe de la souche en cause. 

La methode de diagnostic, selon 1' invention, d'une 
infection meningococcique, et plus particulierement de la 
meningite meningococcique, par mise en evidence de la 
presence de Neisseria meningitidis dans un echantillon a 
analyser, est caracterise par les etapes de : 

- mise en contact, d'un echantillon a analyser, a 
savoir un echantillon biologique ou une culture 
cellulaire, avec un reactif elabore a partir d'au moins 
un acide nucleique tel que defini ci-dessus, le cas 
echeant sous forme de sonde nucleotidique ou d' amorce, ou 
en variante a partir d'au moins un anticorps, ou un 
fragment d' anticorps, tel que defini ci-dessus, dans des 
conditions permettant respectivement une hybridation ou 
une reaction de type antigene-anticorps, et 

- revelation du produit de reaction eventuellement 
forme . 

Lorsque le reactif est elabore a partir d'un acide 
nucleique, celui-ci peut se presenter sous forme de sonde 
nucleotidique dans laquelle 1' acide nucleique, ou un 
fragment de ce dernier, est marque afin de permettre sa 
revelation. Des marqueurs appropries comprennent des 
marqueurs radio-actifs, f luorescents , enzymatiques ou 
luminescents . 

En variante, 1* acide nucleique est inclus dans une 
cellule hote, utilisee comme reactif. 
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Dans ces differentes formes, l'acide nucleique est utilise 
tel quel ou sous forme d'une composition avec des vehicules 
inertes . 

Lorsgue le reactif est elabore a partir d'un anticorps, ou 
d'un fragment d'anticorps, celui-ci peut etre marque aux fins 
de revelation. Le plus couramment, on utilise un marqueur 
fluorescent, enzymatique, radio-actif ou luminescent. 

L'anticorps, ou le fragment d'anticorps utilise, le cas 
echeant, marque, peut etre utilise tel quel ou sous forme d'une 
composition avec des vehicules inertes. 

L 1 echantillon utilise dans l'etape de mise en contact est 
un echantillon biologique, issu d'un mammifere, tel que liquide 
cephalo-rachidien, urine, sang, salive. 

L'etape de revelation est realisee dans des conditions 
permettant de mettre en evidence le produit de reaction 
lorsqu'il s'est forme. Des moyens classiques met tent en oeuvre 
des reactions de fluorescence, luminescence, colorees, radio- 
actives ou encore des techniques d ' autoriadographie . II est 
egalement possible de quantifier le produit. 

Les produits marques, acides nucleiques et anticorps font 
egalement partie en tant que produits nouveaux de 1' invention. 

La methode definie ci-dessus peut etre appliquee au 
diagnostic d'une reaction immunitaire specif ique d'une 
infection meningococcique . 

On utilise alors comme reactif un polypeptide conforme a 
1' invention, tel que code par lesdites sequences d' acides 
nucleiques, correspondant au produit natif, ou un polypeptide 
modifie, mais possedant l'activite biologique et immunologique 
de polypeptide natif correspondant. 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 



18 



PCT7FR97/01295 



II s'agit avantageusement d'un polypeptide tel 
qu'exporte au-dela de la membrane cytoplasmique de 
Neisseria meningitidis, plus particulierement de la 
partie d'un tel polypeptide correspondant a la region 
conservee de l'ADN. 

L' invention vise egalement des kits pour la mise en 
oeuvre des methodes definies ci-dessus. Ces kits sont 
caracterises en ce qu'ils comportent : 

- au moins un reactif tel que defini ci-dessus, a 
savoir de type acide nucleique, anticorps ou polypeptide, 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d ' hybridation 
nucleotidique ou de la reaction immunologique visee, 
ainsi qu ' une notice d ' utilisation. 

La specif icite des produits de 1 * invention et leur 
localisation sur le chromosome de Neisseria meningitidis 
Z2491 soit regroupes en region, pouvant etre interpretees 
comme des ilots de pathogenecite, soit isoles sur le 
chromosome, leur conferent un interet tout particulier 
pour la realisation de compositions vaccinales a visee 
universelle, c'est-a-dire quelque soit la souche et la 
variability qu'elle exprime. Ces compositions peuvent 
inclure dans leur spectre d'autres prophylaxies, et etre, 
par exemple, associees aux vaccins de l'enfance. 

L' invention vise done des compositions vaccinales 
incluant dans leur spectre une prophylaxie a visee anti- 
meningococcique, destinees a prevenir toute infection 
susceptible d'etre provoquee par Neisseria meningitidis, 
ces compositions etant caracterisees en ce qu'elles 
comprennent, en association avec un ou des vehicule(s) 
physiologiquement acceptable( s ) , une quantite efficace de 
polypeptides ou d * anti-anticorps ou de leurs fragments 
tels que definis ci-dessus, ces produits etant 
eventuellement conjugues, afin de renforcer leur 
immogenicite. 
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Des molecules immunogenes utilisables comprennent la 
proteine de polyovirus, la toxine tetanique, ou encore la 
proteine issue de la region hypervariable d'une piline. 

En variante, les compositions vaccinales selon 
5 1 ' invention sont caracterisees en ce qu'elles 
comprennent, en association avec un/des vehicule(s) 
physiologiquement acceptable( s ) , une quantite efficace : 

- d'acides nucleiques tels que definis ci-dessus, 

- de cellules notes transformees telles que definies 
10 plus haut, ou 

- de cellules de Nm dont le chromosome a ete delete 
d ' au moins une sequence d ' ADN selon 1 1 invention impliquee 
dans la pathogenicity de la bacterie. Le materiel 
nucleotidique utilise est avantageusement place sous le 

15 controle d'un promoteur favorisant son expression in vivo 
et la synthese de la proteine correspondante . II est 
egalement possible afin de renforcer 1 ' immunogenic! te, 
d ' associer ce materiel nucleique avec un ADN ou un ARN 
encodant une molecule porteuse telle que proteine de 

20 polyovirus, toxine tetanique, proteine issue de la region 
hypervariable d'une piline. 

Les compositions vaccinales de 1 ' invention sont 
administrables par voie parenterale, sous-cutanee, 
intramusculaire ou encore sous forme de spray. 

25 D'autres caracteristiques et avantages de 

1 1 invention sont donnes dans les exemples qui suivent 
afin d'illustrer celle-ci sans toutefois en limiter sa 
portee . 

Dans ces exemples, il sera fait reference aux 
30 figures 1 a 11 qui representent respectivement 

- les figures 1A, IB, 1C, ID, IE, IF et 1G 1 ' analyse de 
la banque soustractive Tsp5091, 

la figure 2, la distribution de sequences Nm- 
specifiques par rapport a Ng sur le chromosome de la 
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souche Z2491, ( partie gauche) et de sequences Nm 
specif iques par rapport a Nl (partie droite), 

- la figure 3A a 3C, la reactivate des clones des 3 
regions du chromosome, selon 1' invention, envers une 

5 panel de souches du genre Neisseria , 

- la figure 4, la position, dans la region 2 du 
chromosome de Nm, d ' oligonucleotides utilises comme 
sondes , 

- les figures 5, 6 et 7, les Southern blots d ' un panel de 
10 souches du genre Neisseria, en utilisant des parties de 

la region 2 de Nm comme sondes, 

- les figures 8 A a 8C, les Southern blots avec 3 banques 
soustractives sur un panel de 12 souches de Neisseria, et 

- les figures 9, 10 et 11, la reactivite de clones des 3 
15 banques soustractives vis-a-vis de Nm, Nl et Ng. 

Dans les exemples qui vont suivre, les materiels et 
methodes suivants ont ete utilises : 

Souches bacteriennes - Pour la realisation des banques 
soustractives, on a utilise la souche Z2491 de Nm 

20 (Achtman et a!., 1991, J. Infect. Dis. 164, 375-382) les 
souches MS11 ( Swanson et al., 1974, Infect. Immun. 10, 
633-644), et les souches 8064 et 9764 de Nl, etant 
entendu que tout autre souche de 1 ' espece consideree 
pourrait etre utilisee. 

25 Afin de verifier la specif icite de ces banques, 6 

souches de Nm, 4 souches de Ng, une souche de Nl 
(Neisseria lactamica) et une souche de Nc (Neisseria 
cinerea) ont ete utilisees. 

Les six souches de Nm sont : Nm Z2491 de serogroupe 

30 A, Nm 8013 de serogroupe C (XN collection), Nm 1121 non 
serogroupable (XN collection), Nm 1912 serogroupe A (XN 
collection), Nm7972 de serogroupe A (XN collection) et Nm 
8216 de serogroupe B (XN collection). 

Les quatre souches de Ng sont : Ng MS11 ( Institut 

35 Pasteur, Paris), Ng 403 (Institut Pasteur, Paris), Ng 
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6934 ( Institut Pasteur, Paris), Ng WI (isolee a partir 
d'une infection gonococcique disseminee), Ng 4C1, Ng 6493 
et Ng FA 1090. 

Les souches de Nl sont Nl 8064 et Nl 9764 (XN 
5 collection) et celle de Nc, Nc 32165 (XN collection). 
Techniques de genetique moleculaire 

Sauf indication contraire, les techniques et 
reactifs utilises correspondent a ceux recommandes par 
Sarabrook et al (Sambrook et al 1989, Molecular Cloning: 
10 A Laboratory Manual. Cold Spring Harbor Laboratory 
Press ) . Les oligodesoxynucleotides utilises dans cette 
etude sont : 



RBaml2, 3 ' AGTGGCTCCTAG 54 ( SEQ ID N*54) 

15 RBam24, 5' AGCACTCTCCAGCCTCTCACCGAG 3'; (SEQ ID N*55) 

Jbaml2, 3' GATCCGTTCATG 5'; (SEQ ID N'60) 

JBAM24, 5' ACCGACGTCGACTATCCATGAACG 3'; (SEQ ID N*61) 

REcol2, AGTGGCTCTTAA; (SEQ ID N*56) 

REco24, 5* AGCACTCTCCAGCCTCTCACCGAG 3'; (= RBam 24) 

20 JEcol2, GTACTTGCTTAA; (SEQ ID N'62) 

JEC024, 5' ACCGACGTCGACTATCCATGAACG 3*; (= JBam24 ) 

NEC012, AATTCTCCCTCG; (SEQ ID N'64) 

NEco24, AGGCAACTGTGCTATCCGAGGGAG; (SEQ ID N*65). 

25 Transferts sur membranes (Southern blots) 

Les transferts sur membranes ont ete realises par 
transferts capillaires sur des membranes en nylon 
chargees positivement (Boehringer Mannheim). Les 
hybridations ont ete realisees a 65 *C dans une solution 

30 comprenant NaPi 0,5M pH7,2/EDTA ImM/SDS 7%/ BSA 1%. Les 
lavages des membranes ont ete realisees dans une 
solution comprenant NaPi 40mM pH7,2/EDTA ImM/SDS 1%. Le 
lavage final a ete realise a 65'C pendant 5 min. 

La sonde frp, obtenue avec des oligonucleotides 

35 bases sur la sequence de frpA correspond a 2,4 kb de 
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l'extremite 5' du gene de la souche Z2491. Les sondes 
opc et rotamase correspondant aux genes entiers sont 
produites a partir de la souche Z2491 en utilisant des 
oligonucleotides realises sur la base de sequences 
publiees. Les sondes pllCl et ppk (polyphosphate kinase) 
correspondent aux inserts des plasmides pJLl et 
pBluePPK6001, respectivement. 

Example 1 : Realisation de banmies ri'An N presents rhp^ 
Nm et absents rh P 7 , 

a. Banque "Mbol" 

Realisation - L'ADN de Nm Z2491 a ete clive par 
l'endonuclease Mbol et soumis a deux iterations d ' une 
methode, appelee ci-apres CDA (Comprehensive Difference 
Analysis). Cette methode comprend une hybridation 
soustractive en presence d'un exces d'ADN cisaille de Ng 
MS11 et une amplification par PCR de celles des sequences 
meningococciques qui, etant absentes de ou ne presentant 
pas d'homologie significative avec l'ADN de Ng MS11, 
pouvaient se re-anneler. 

L'ADN chromosomique de la souche Ng MS11 est 
cisaille de maniere aleatoire par passages repetes a 
travers une seringue hypodermique jusqu'a obtention de 
fragments dont la taille s'echelonne de 3 a 10 kb. Ces 
fragments d'ADN sont purifies par extraction phenolique. 

L'ADN chromosomique de la souche Nm Z2491 est, quant 
a lui, clive par l'endonuclease de restriction Mbol. Ces 
fragments d'ADN (20 ug) sont ligatures a 10 nmoles des 
oligonucleotides anneles RBaml2 et RBam24. Les amorces en 
exces sont eliminees par electrophorese sur un gel 
d' agarose a 2% a bas point de fusion. La partie du gel 
contenant des fragments amplifies de taille superieure a 
200 pb est excisee et digeree par la (3-agarase. Ces 
fragments sont purifies par extraction phenolique. 
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Afin de realiser une hybridation soustractive 
(premiere iteration), 0,2 ug d'ADN Nm, ligature aux 
oligonucleotides RBam, est melange a 40 i_ig d'ADN Ng dans 
un volume total de 8 ml d ' un tampon EE 3X ( un tampon EE 
5 IX est compose de N-( 2-hydroxyethyl ) piperazine-N ' -( acide 
sulphonique propane 3) 10 mM et d'EDTA 1 mM, son pH est 
de 8.0). Cette solution est recouverte d'huile minerale 
et l'ADN est denature par chauffage a 100 *C pendant 2 
min. 2 yl de NaCl 5M sont ajoutes et on laisse le melange 
10 s'hybrider a 55 *C pendant 48h. Le melange reactionnel est 
dilue a 1/10 dans une solution prechauffee composee de 
NaCl et de tampon EE, puis immediatement place sur de la 
glace. 

10 ul de cette dilution sont ajoutes a 400 ul de 
15 melange reactionnel pour PCR (Tris.HCl pH9.0 lOmM; KC1 50 
mM; MgCl2 1,5 mM; Triton X100 0,1 %; 0,25 mM de chacun 
des quatre desoxynucleotides triphosphate ; Taq 
polymerase 50 unites par ml). Le melange est incube 
pendant 3 min a 70 *C pour completer les extremites des 
20 fragments re-anneles d'ADN meningococciques. 

Apres denaturation a 94 *C pendant 5 min et addition 
de 1 'oligonucleotide RBam24 a raison de 0,1 nmole par 100 
yl, les hydridations sont amplifiees par PCR (30 cycles 
de 1 min a 94 *C, 1 min a 70 *C et 3 min a 72 *C suivis par 
25 1 min a 94*C et 10 min a 72'C; Perkin-Elmer GeneAmp 
9600) . 

Les fragments meningococciques amplifies sont 
separes sur gel des amorces et des ADN gonococciques de 
hauts poids moleculaires . lis sont digeres par Miol et de 
30 nouveaux oligonucleotides JBaml2 et JBam24 leur sont 
ligatures. Ces ADN ligatures sont a nouveau purifies sur 
gel et extraits au phenol. 

Une seconde iteration d ' hybridation soustractive est 
realisee sur 40 pg d'ADN Ng cisaille de maniere aleatoire 
35 et 25 ng d'ADN ligature aux oligonucleotides JBam tel 
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qu'obtenu a 1 ' issue de la premiere iteration 
d' hybridation soustractive. Lors de cette seconde 
iteration, 1 ' amplification de l'ADN Nm auto-annele est 
realisee a 1 ' aide de 1 ' oligonucleotide Jbam24. 

Specificite - Afin de confirmer leur Nm- 
specificite, les sequences amplifliees apres la seconde 
iteration de la methode CDA sont marquees et utilisees 
comme sonde pour de l'ADN digere par Clal issu d'un panel 
de six souches de Neisseria meningitidis, quatre de 
Neisseria gonorrhoeae, une de Neisseria lactamica et une 
de Neisseria cinerea. 

Les Southern blots realises montrent que les 
sequences amplifliees a 1 • issue de la seconde iteration 
de la methode CDA presentent une forte reactivite avec de 
nombreuses bandes correspondant aux meningocoques et ne 
presentent pas de reactivite avec les bandes 
correspondant aux souches Ng, Nl, Nc. 

La banque "Mbol" apparait done comme Nm-specifique. 
Exhaustivite - Afin de tester 1 ' exhaustivite de la 
banque, 1 ' ensemble des produits issus de la premiere et 
de la seconde iterations de la methode CDA ainsi que les 
materiaux chromosomiques initiaux de Nm Z2481 et de Ng 
MS11 sont soumis a electrophorese sur gel d' agarose, 
trans feres sur membrane et mis en contact avec des sondes 
comprenant des genes connus pour etre meningococcus - 
specifiques, a savoir frp, opc, rotamase (Southern blot). 

II resulte de ces hybridations que le gene Nm- 
specifique frp est represents dans la banque Mbol par un 
fragment de 600 pb, mais qu'aucune activite n'est 
observee pour les genes rotamase et opc. La banque Miol, 
bien que Nm-specifique, ne peut done etre consideree 
comme exhaustive. 

Etant donne leur haute specificite, les fragments 
issus de la seconde iteration de la methode CDA pour la 
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banque Mbol peuvent neanmoins etre clones sur le site 
BamHI du plasmide pBluescript. 

Une sequence correspondant a un quelconque des genes 
Nm-specifiques ne peut etre incluse dans la banque 
5 soustractive que si elle est portee par un fragment de 
restriction de taille appropriee. Cette condition est 
fonction de deux facteurs. Premierement , la probability 
pour que les plus grands fragments soient entierement Nm- 
specifiques est faible. Deuxiemement , meme si de tels 

10 fragments existaient, ils seraient sous-representes dans 
la banque du fait des limitations de la technique PCR 
dont l'efficacite d ' amplification diminue avec 
1 ' augmentation de la taille des fragments. Les fragments 
de taille superieure a environ 600 pb ne sont pas inclus 

15 dans la banque. Du fait de l'abscence, dans le chromosome 
de Nm Z2491, de fragments Mbo de taille appropriee, les 
genes rotamase et opc ne peuvent etre inclus dans la 
banque. Une enzyme quelconque ne peut a elle seule 
produire un petit fragment correspondant a un gene Nm- 

20 specif ique quelconque. Une deuxieme banque a done ete 
realisee en utilisant une autre enzyme de restriction 
avec une specif icite differente : Tsp509. 

b. Banque "Tsp509l" 
25 Realisation - L' enzyme Tsp5091 presente 1 ' avantage 

de produire des fragments de plus petite taille 
(inferieure a 1 kb environ) que 1' enzyme Mbol . 

Tsp509l reconnait la sequence AATT et laisse, en 
saillie en 5 ' , une sequence de 4 bases compatible avec 
30 BcoRI. Les oligonucleotides utilises sont Reco, Jeco et 
NEco. 

La methode suivie est conforme a celle suivie pour 
la realisation de la banque "Mbol" decrite ci-dessus. De 
plus fortes quantites d'ADN meningococciques ont 
35 cependant ete utilisees pour la premiere iteration 
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d 'hybridation soustractive afin de compenser le plus 
grand nombre de fragments de faibles poids moleculaires 
produits par Tsp509l. Pour la premiere iteration, 400 ng 
de fragments d'ADN Nm et, dans la seconde, 25 ng de 
5 fragments Nm sont soumis a hybridation soustractive avec 
40 ug d'ADN Ng cisaille de maniere aleatoire. 

Pour la realisation de cette banque "rsp509l", a 
titre de controle, une troisieme iteration d ' hybridation 
soustractive est realisee en utilisant 40 ug d'ADN Ng 
10 cisaille et 0,2 ng de fragments Nm resultant d'une 
digestion par Tsp509l et d'une re-ligature aux 
adaptateurs NEco des fragments obtenus a 1 * issue de la 
seconde iteration. 

Specificite - Comme decrit pour la banque 
15 precedente, le produit issu de la deuxieme iteration de 
la methode CDA est marque et utilise comme sonde pour un 
panel de souches de Neisseria. 

La figure 1A illustre 1 ' hybridation Southern blot 
des produits de la seconde iteration de la methode CDA 
20 avec 1'ADN digere par Clal de : Nm en piste a, de Ng MS11 
en piste b, de Nm 8013 en piste c, de Ng 403 en piste d, 
de Nm 1121 en piste e, de Ng 6934 en piste f, de Nm 1912 
en piste g, de Ng WI (souche DGI) en piste h, de Nm 7972 
en piste i, de Nl 8064 en piste j, de Nc 32165 en piste 
25 k, de Nm 8216 en piste 1. 

Contrairement a la forte reactivite observee avec 
toutes les souches Nm, une faible, ou aucune reactivite, 
est observee avec les souches Ng, Nl et Nc. 

La specifite de la banque a ete etudiee plus avant 
30 en faisant reagir des transferts sur membrane (Southern 
blots) des produits issus de chacune des trois iterations 
de la methode CDA avec des sondes correspondant a pilCl 
et ppk. Ces deux genes sont communs a Nm et Ng. 

La figure IB represente un gel d' agarose apres 
35 electrophorese des chromosomes de Nm Z2491 et Ng Msll, 
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digeres avec Tsp509 et des produits issus de chacune des 
iterations de la methode CDA. 

En piste a, a ete depose 1 pg du chromosome de Nm, 
en piste b 1 pg de celui de Ng, en piste c 0,15 pg des 
5 produits issus de la premiere iteration CDA, en piste d 
0,1 pg de ceux de la seconde iteration, en piste e 0,05 
pg de la troisieme iteration, MW representant les 
marqueurs de taille moleculaire. 

Les figures 1C et ID representent des gels realises 
10 comme decrits en figure IB apres transfert sur membrane 
(Southern blots) et hybridation avec pilCl (figure 1C) et 
ppk (figure ID). 

A 1 1 issue de la seconde interation de la methode 
CDA, les sequences correspondant aux genes pilCl et ppk 
15 sont completement exclues de la banque. 

Exhaustivite - L ' exhaustivite de la banque a ete 
examinee en faisant reagir les produits issus de 
1 ' hybridation soustractive avec des sondes correspondant 
a trois genes Nm-specif iques (frp, rotamase et opc) . 
20 Ces sondes Nm-specif iques reagissent avec les 

produits d ' amplification issus de la premiere et de la 
seconde iteration d ' hybridation soustractive. 

Les figures IE, IF et 1G representent des gels 
realises comme decrits en figure IB apres transfert sur 
25 membrane (Southern blots) et hybridation avec frpA 
(figure IE), rotamase (figure IF) et opc (figure 1G). 

Une troisieme iteration d ' hybridation soustractive 
conduit cependant a la perte de sequences Nm-specif iques 
car les fragments reagissant avec les genes rotamase et 
30 opc sont absents de cette troisieme iteration. 

En considerant 1' ensemble de ces donnees, il resulte 
que les produits issus de la seconde iteration de la 
methode CDA sont Nm-specif iques et constituent egalement 
une banque exhaustive des sequences Nm-specif iques . 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



PCT/FR97/01295 



Les produits issus de cette deuxieme iteration sont 
clones au niveau du site EcoRI du plasmide pBluescript. 

La banque produite par Tsp509l est plus exhautive 
que la banque produite par Mbol , comme les 
considerations theoriques basees sur la production 
enzymatique de plus petits fragments de restriction le 
supposaient. 

Selon cet aspect, il faut aussi noter que la banque 
rsp509l est moins redondante que la banque Miol c'est-a- 
dire qu'elle comprend moins de duplication de clones. 
86% des clones de la banque Tsp509l correspondent a des 
sequences distinctes alors que seulement 43% des clones 
correspondent a des sequences distinctes dans la banque 
Miol (donnees non presentees). 

La banque produite par Tsp509l constitue done une 
source de clones Nm-specif iques. 

5xempJ, g 3 ; final ysp j es cJ,o nP , s d es banm.P. soustrartivp. 

Clonage et sequencage des ADN Nm-specif iques 

Les ADN des banques soustractives sont clones au 
niveau du site BamHl (banque Mbol) ou EcoRI (banque 
Tsp509l) du plasmide pBluescript, puis transformes dans 
DH5a de E. coll. Les inserts sont amplifies par PCR 
realisee sur les colonies transformees en utilisant les 
amorces M13-50 et M13-40, cette derniere amorce etant 
biotinylee a son extremite 5 ' . 

Le sequencage a ete realise sur chaque produit PCR 
apres separation des brins biotinyles et non-biotinyles 
en utilisant le systeme Dynabeads M-280 a streptavidine 
(Dynal, Oslo). Les sequences sont criblees selon leurs 
homologies avec des sequences precedemment publiees en 
utilisant les programmes informatiques Blastn et Blastx 
(NCBI, USA et Fasta). 
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Les produits PCR issus des colonies de bacteries 
transformees, apres utilisation des amorces M13-40 et 
M13-50 comme decrit ci-dessus, ont ete marques par 
incorporation avec amorgage aleatoire de a - 32 p-dCTP et 
5 ont ete utilises comme sonde pour les transferts sur 
membrane de l'ADN chromosomique digere par Clal des 
souches Nm Z2491 et Ng MS11, comme decrit ci-dessus afin 
de verifier leur specificite. 

1° Cartographie des clones sur le chromosome de la 

souche Nm Z2491. 

On rapporte les resultats des etudes effectuees avec 
17 clones de la banque "Mbol" (designes par la lettre B) 
et 16 clones de la banque "Tsp5091" (designes par la 
15 lettre E), chacun de ces clones presentant une sequence 
unique et sans contrepartie chez Ng. 

Les positions des sequences d'ADN correspondant aux 
produits Nm-specif iques clones ont ete determinees par 
rapport a la carte publiee du chromosome de Nm Z2491 
20 (Dempsey et al. 1995, J. Bacteriol. 177 . 6390-6400) et a 
1 ' aide de transferts sur membranes ( Southern blots ) de 
gels d ' agarose ayant ete soumis a electrophorese a champ 
pulse (PFGE). 

Les clones Nm-specif iques sont utilises comme sondes 
25 pour une hybridation sur membranes ( Southern blots ) de 
l'ADN de Nm Z2491 digere avec des enzymes a rares sites 
de coupure, a savoir Pad, Pmel, Sgfl, Bglll, Spel Nhel 
que Sgfl. 

Les gels (20 x 20 cm) etaient des gels a 1% 
30 d' agarose dans un tampon TBE 0,5X et ont ete soumis a 
electrophorese a 6 V/cm pendant 36 heures selon des 
periodes de pulsation variant de maniere lineaire entre 
5 et 35 secondes. 

Les hybridations sur membrane ( Southern blots ) ont 
35 ete realises comme decrit precedemment . 
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Les resultats obtenus sont rapportes sur la figure 
2 : la reactivite a ete localisee par comparaison avec 
les positions des fragments de taille correspondante sur 
la carte publiee. Les positions de 1' ensemble des 
marqueurs genetiques cartographies par Dempsey et al 
(precedemment cite) sont visualisees a 1 ' aide de points 
sur la carte lineaire chromosomique . Les genes Nm- 
specif iques precedemment divulgues sont marques d'un 
asterisque. Les deux loci appeles "frp" correspondent aux 
genes frpA et frpC. Les locis " pllC" correspondent aux 
genes pilCl et pilC2 qui sont des paires de genes 
homologues et qui ne sont pas distingues sur la carte. La 
precision des positions des clones Nm-specif iques de 
1 1 invention depend des chevauchements des fragments de 
restriction reactifs. En moyenne, la position est de +/- 
20 kb. 

Cette cartographie revele une distribution non 
aleatoire des sequences Nm-specif iques . La majorite des 
sequences Nm-specif iques appartiennent a trois groupes 
distincts . Un de ces groupes ( region 1 ) correspond a la 
position de genes relatifs a la capsule precedemment 
decrits . 

On distingue : 

- E109, E138, B230 et B323 comme etant la region 1, 

- B322, B220, B108, B132, B233, B328, E139, E145 et 
B101 comme etant la region 2, et 

- B306, E114, E115, E124, E146, E120, E107, E137 et 
E142 comme etant la region 3. 

63% des sequences identifiees comme specifiques des 
meningocoques sont localisees a l'interieur de ces trois 
regions distinctes. 

Ce regroupement contraste avec la distribution de 
genes Nm-specif iques precedemment divulgues (frpk, frpC 
porh, opc et la region relative a la capsule). 
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Cet art anterieur suggerait en effet que les genes 
Nm-specifiques etaient a 1' exception des genes 
fonctionnellement relatifs a la capsule, disperses le 
long du chromosome. 

La cartographie des sequences Nm-specifiques sur le 
chromosome conduit a un resultat inattendu en regard de 
l'art anterieur. 

La majorite des differences genetiques entre les 
souches meningoccale et gonococcale testees sont 
regroupees en trois regions distinctes. 

La region 1 regroupe des genes relatifs a la capsule 
des meningococci. 

La fonction des genes des autres regions n'est pas 
connue mais des homologies avec des sequences publiees 
( tableau 1 ) suggerent des similarites entre certains 
genes de la region 3 et les proteines transposases et de 
regulation de bacteriophages. Aucun virus meningococcal 
n'a ete caracterise et il est tentant d'imaginer que ces 
sequences soient d'origine phagique. De maniere 
interessante, le genome de H. influenzae contient 
egalement une sequence homologue a celle de la proteine 
de regulation Ner du phage Mu mais on ne sait pas s'il 
s ' agit d ' un gene f onctionnel . 

Le clone B208 presente une forte homologie (48% 
d'identite, 91% d' homologie pour 33 acides amines) avec 
un clone des regions conservees (domaine III) dans la 
classe des proteines qui se lient aux siderophores 
f erriques TonB-dependants . 

La proximite de ce clone avec les genes Nm- 
specifiques porA et les genes regules par le fer frp, et 
en particulier la possibility qu'il s'agisse d'une 
proteine recepteur Nm-specif ique exposee sur la membrane 
externe font de lui un bon candidat pour de plus amples 
recherches. 
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Le clone B339 correspond a la sequence d' insertion 
Nm-specifique IS1106. 

La faible homologie entre le clone B134 et la 
sequence d' insertion d ' Reromonas , ainsi que la presence 
en copies multiples du clone B134 parmi des souches 
variees de Nm, suggerent qu'il pourrait representer un 
nouveau type de sequence d' insertion Nm-specifique. 

La possibility pour que les regions contenant les 
clones Nm-specif iques puissent correspondre a des ilots 
de pathogenicite comme precedemment deer it pour E. coll 
et Y . pestis est d'un interet particulier. 

Les clones isoles dans cette invention vont 
permettre de mieux comprendre la pertinence des regions 
Nm-specifiques en permettant le clonage et le sequencage 
de fragments chromosomiques plus grands et directement 
par leur utilisation pour des mutations de loci. 

Enfin, la detection des genes meningococcus - 
specif iques, eventuellement impliques dans la 
pathogenicite de l'organisme, permet de cibler des 
antigenes appropries utilisables dans un vaccin anti- 
meningococcique . 

L'efficacite et la rapidite de la methode selon 
1* invention permettent son utilisation dans un grand 
nombre de situations pour lesquelles les differences 
genetiques responsables d'un phenotype particulier a un 
de 2 pathogenes proches sont recherchees. 

Etude de la reactivite des clones des regions 1, 2 et 3 
vis-a-vis d'un panel de souches de Neisseria 

Les produits PCR correspondant aux inserts de chacun 
des clones ont ete rassembles et utilises comme sondes 
d ' hybridation sur membranes (Southern blots) pour un 
panel de souches de Nm, de Ng, de Nl et de Nc. 

Les regions 1 et 2 produisent un nombre limite de 
bandes pour chacun des meningocoques . Cela suggere que 
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ces regions sont a la fois Nm-specif iques et communes a 
tous les meningocoques . 

La figure 3 illustre la reactivite des clones des 
regions 1, 2 et 3 envers un panel de souches 
5 neisseriales . Les clones des regions 1 (figure 3A), 2 
(figure 3B) et 3 (figure 3C) pris ensemble ont ete 
utilises comme sondes envers un panel de meningococci, 
gonococci et envers une souche de Nl et de Nc. 

Les pistes sont les suivantes : ADN de Nm Z2491 en 
10 piste a, de Ng MS11 en piste b, de Nm 8013, en piste c, 
de Ng 403 en piste d, de Nm 1121 en piste e, de Ng 6934 
en piste f, de Nm 1912 en piste g, de Ng WI (souche DGI ) 
en piste h, de Nm 7972 en piste i, de Nl 8064 en piste j, 
de Nc 32165 en piste k, de Nm 8216 en piste 1. 
15 De maniere remarquable, la region 3 ne presente de 

reactivite qu'avec les meningococci de serogroupe A. 
Cette region 3 est done specif ique d'un sous-groupe de 
Nm. 

Une comparaison avec des sequences connues dans les 
20 banques de donnees a ete realisee afin d'evaluer les 
possibles fonctions des regions donees. 

Le tableau 1 qui suit donne les positions des clones 
specif iques sur la carte chromosomique et les homologies 
avec des sequences connues. 
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On peut voir, tout d'abord, que les clones de la 
region 1 correspondent tous aux genes impliques dans la 
biosynthese de la capsule. Ces genes ont ete precedemment 
etudies parmi les Nm de serogroupe B ( Frosch et al. 1989, 
5 Proc. Natl. Acad. Sci. USA 8_6_, 1669-1673 et Frosch et 
Muller 1993, Mol. Microbiol. S. 483-493). 

A 1 ' exception d ' une f aible homologie avec 
l'activateur de hemolysine de Serratla marcescens , les 
clones de la region 2 ne presentent aucune homologie 
10 significative avec les sequences publiees, que ce soit au 
niveau de l'ADN ou des proteines. 

Deux des clones de la region 3 presentent 
d' interessantes homologies avec des proteines qui se 
lient a l'ADN, en particulier les proteines de regulation 
15 et les proteines transposases de bacteriophages. 

Le clone B208 presente une forte homologie avec une 
des regions conservees dans une classe de recepteurs 
( siderophore f errique TonB-dependant ) . 

Les clones B134 et B339 s'hybrident avec de 
20 nombreuses regions du chromosome (au moins 5 et au moins 
8 , respectivement ) . 

Les donnees concernant les sequences montrent que le 
clone B339 correspond a la sequence d' insertion Nm- 
specifique SII06. 
25 La traduction du clone B143 presente une homologie 

limitee avec la transposase d'une sequence d' insertion 
Aeromonas ( SAS2 ) ( Gustaf son et al. 1994, J. Mol. Biol. 
221, 452-463 ) . Nous avons pu demontrer par transf ert sur 
membrane (Southern blots) que ce clone est une entite Nm- 
30 specif ique presente en multiples copies dans les 
chromosomes de chaque meningocoque du panel teste. 

Les autres clones ne presentent pas d' homologie 
significative avec les sequences neisseriales publiees ni 
d'ailleurs avec aucune sequence publiee. Ces clones 
35 constituent done, avec la majorite des autres clones 
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isoles, une banque de loci Nm-specif iques totalement 
nouveaux . 

Examnle 3 : Ktnd P . de l a reg i on 2 du chromosome de Nm 

5 

. Determination et caracterisation de la sequence de 
la region 2 

On procede a une amplification par PCR avec de l'ADN 
chromosomique de la souche Z2491 de serogroupe A, sous- 

10 groupe IV-1, en utilisant des amorces d * oligonucleotides 
elaborees a partir de chacune des sequences de clones de 
la region 2, selon de nombreuses combinaisons 
differentes. On sequence les produits de la PCR qui se 
chevauchent a partir des 2 brins en utilisant la 

15 technique de terminaison de chaine et le sequencage 
automatise (ABI 373 ou 377). 

Pour prolonger la sequence au-dela des limites des 
clones disponibles, on clone des fragments partiels 
SauIIIA de 15 kb, de la souche Z2491, dans Lambda DASH- 

20 II (Stratagene) . 

On identifie les phages contenant les inserts 
chevauchant la region 2 par hybridation avec comme sondes 
des clones de cette region. L'ADN insere est sequence a 
partir des extremites des inserts et ces sequences sont 

25 utilisees pour elaborer de nouvelles amorces qui 
serviront a amplifier directement l'ADN chromosomique et 
non 1 ' ADN phagique . 

On obtient une amplification de l'ADN chromosomique 
en utilisant ces nouvelles amorces et celles de la 

30 sequence precedemment disponible. 

Ces produits PCR sont egaleraent sequences a partir 
des 2 brins , ce qui conduit a une sequence complete de 
15620 pb (SEQ ID N*36). On analyse les cadres de lecture 
de cette sequence qui commencent par ATG ou GTG et qui 

35 sont caracterises par un indice d' usage de codons eleves . 
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Cette analyse revele 7 COLs de ce type qui remplissent la plus grande partie de la 
sequence de 15620pb. Les positions de ces COLs sont les suivantes: 
COL-1: 1330 a 2970 (SEQ ED N°37); COL-2: 3083 a 9025 (SEQ ED N°38); COL-3: 
9044 a 9472 (SEQ ED N°39); COL-4: 10127 a 12118 (SEQ ED N°40); COL-5: 12118 a 
12603 (SEQ ED N°41); COL-6: 12794 a 13063 (SEQ ED N°43); COL-7: 13297 a 14235 
(SEQ ED N°44); et COL-8: 14241 a 15173 (SEQ ED N°45). 

Le COL-4 commence avec le codon GTG et chevauche un COL legerement plus 
petit (SEQ ED N°41) dans le meme cadre de lecture (9620-12118, cadre 2) et qui 
commence par le codon ATG. 

COL-4 code pour une proteine qui presente des homologies structurelles avec 
une famille de polypeptides comprenant les pyocines (Pseudomonas aeruginosa), 
collcines et intimines (Escherichia coli) qui sont des toxines bactericides (pyocines, 
collcines) ou des proteines de surfaces impliquees dans l'adhesion des bacteries aux 
proteines eucaryotes. Le COL-7 encode une proteine dont la sequence contient une 
region potentiellement transmembranaire, et qui presente des homologies structurelles 
avec des proteines periplasmiques ou inserees dans la membrane externe des bacteries. 
Les homologies structurelles de COL-4 et COL-7 ont ete identifiees a l'aide du 
programme Prop Search. 

La recherche de sequences homologues aux autres COL dans GenBank a l'aide 
du programme BLAST a revele une homologie entre les regions N-terminales de COL-2 
et l'hemagghrinine filamenteuse B de Bordetella pertussis (43% de similarity 36% 
d'identite sur 352 acides amines) et entre COL-1 et la proteine fhaCde Bordetella 
pertussis (35% de similarite, 27% d'identite sur 401 acides amines). COL-1 et COL-2 
sont des genes voisins dans la souche Z2491 et l'hemagglutinine filamenteuse B de 
Bordetella pertussis et fhaC sont des genes voisins dans Bordetella pertussis, ce qui 
renforce la probability que ces homologies refletent des homologies fonctionnelles. 

. Confirmation de la specificite de la region 2 vis-a-vis de Nm 

On effectue des Southern blots en utilisant des sondes d'ADN obtenues par 
amplification par PCR de differentes parties de la region 2 en utilisant des amorces 
ohgonucleotidiques elaborees a partir de sequences de clones de la region 2. 

On a represente sur la figure 4 la position approximative de ces oligonucleotides. 
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II s'agit, dans une moitie de COL-1, des 
oligonucleotides appeles R2001 ( SEQ ID N'46) et R2002 
(SEQ ID N*47), dans une moitie de COL-l+la majeure partie 
de COL-2, des oligonucleotides b332a (SEQ ID N*48), el39a 
(SEQ ID N'49), bl32a (SEQ ID N*50) et b233b (SEQ ID 
N'51), et dans 1/3 de COL-4+ COL-5 a 7, des 
oligonucleotides el45a (SEQ ID N*52) et blOla (SEQID 
N'53). 

Les trois Southerns sont realises dans les 
conditions d ' hybridation suivantes: 
16 h a 65'C, 
NaP0 4 0,5M, pH 7,2 
EDTA-Na 0,001M 

1% de dodecylsulfate de sodium. 

Pour le lavage, on chauffe 10 min a 65 *C et on 
utilise NaPO< 0,5M, pH 7,2; EDTA-Na 0,001M, 1% de 
dodecylsulfate de sodium. 

Les figures 5, 6 et 7 representent respectivement 
les Southern blots obtenus avec chacune des parties de 
COL mentionnees plus haut. 

Les 14 pistes correspondent respectivement, dans 
chacun des Southerns, a 
1: MS11 (Ng) 
2: 403 (Ng) 
3: FA1090 (Ng) 
4: Wl (Ng) 
5: 6493 (Ng) 

6: marqueur (lambda hindlll) 

7: Z2491 (Nm, gpA) 

8: 7972 (Nm gpA) 

9: 8013 (Nm, gpC) 

10: 1121 ( Nm non groupable) 

11: 1912 (Nm, gpB) 

13: 32165 ( Nc ) 
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14: 8064 (Nl). 

Etant donne qu ' un panel de souches de Neisseria est 
utilise dans ces experiences et que chaque puits est 
charge avec une quantite similaire d'ADN digere, ces 3 
Southerns blots montrent clairement que les sequences 
correspondant a la region 2 sont trouvees dans tous les 
meningoccoques testes et qu'il n'existe pas dans le 
genome de Ng des souches testees de sequences homologues 
significatives. 

Exemple 4; Identification de regions d» genome dP Nm 
absentes de Nl et communes avpp Ng 

On opere selon la technique decrite dans 1 ' exemple 
1, mais on utilise l'ADN chromosomique d'une souche de Nm 
(Z2491) et de 2 souches de Nl (collection XN) dont on 
melange les ADN a parts egales. 

On efffectue 2 soustractions en utilisant les series 
d' amorces R et J. Trois banques differentes sont ainsi 
realisees. 

Deux banques, appelees Bam et Eco, sont 
respectivement obtenues par digestion de l'ADN 
chromosomique de Nm Z2491 par Mbol et Tsp5091; une 
troisieme banque, appelee Cla, qui resulte de la 
digestion de l'ADN chromosomique de Nm par Mspl, est 
obtenue en utilisant le jeu d' amorces RMsplO, RMsp24, 
JMsplO et JMsp24. L' ensemble des amorces utilisees est 
donne dans le tableau 2 suivant. 
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Tableau 2 



Adaptateurs pour banques dif f erentielles 



ADN chromosomique digere par Clonage dans 
pBluescript par 

Mbol -> BamHI 

Tsp509l -» EcoRI 

Mspl -> cial 



Premier tour de soustraction 

RBaml2 : 3' AGTGGCTCCTAG 5' (SEQ ID N'54) 

RBam24 :5" AGCACTCTCCAGCCTCTCACCGAG 3' (SEQ ID N'55) 

REcol2 : AGTGGCTCTTAA (SEQ ID N'56) 

RBam24 : 5 ' AGCACTCTCCAGCCTCTCACCGAG 3' (SEQ ID N*55) 

(REco 24 = RBam 24) 

RMsplO : AGTGGCTGGC (SEQ ID N'57) 

RMsp24 : 5 ' AGCACTCTCCAGCCTCTCACCGAC 3' (SEQ ID N'58) 



Deuxieme tour de soustraction 

Jbaml2 : 3' GTACTTGCCTAG 5' (SEQ ID N'59) 

JBam24 : 5' ACCGACGTCGACTATCCATGAACG 3' (SEQ ID N'60) 

JEcol2 : GTACTTGCTTAA (SEQ ID N'61) 

JBam24 : 5 ' ACCGACGTCGACTATCCATGAACG 3' (SEQ ID N'60) 

(JEco 24 = JBam 24) 

JMsplO : GTACTTGGGC (SEQ ID N'62) 

JMsp24 : 5 T ACCGACGTCGACTATCCATGAACC 3 * ( SEQ ID N*63) 
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Apres 2 soustractions, on marque la totalite du 
produit de chaque amplification et on 1' utilise comme 
sonde. 

5 On effectue un controle des banques soustractives 

par Southern blot sur un panel de 12 souches de Neisseria 
(ADN chromosomique coupe par Clal ) . Les conditions 
d' hybridation sont identiques a celles donnees dans 
1 ' exemple 1 . 

10 Ces Southern blots sont donnes sur les figures 8A a 

8C, qui sont respectivement relatives a la banque 
MboI/BamHI, a la banque Mspl/Clal et a la banque 
Tsp5091/EcoRl. 

Les 12 pistes correspondent respectivement a : 
15 1: Nm Z2491 ( groupe A) 
2: Nl 8064 

3: Nm 8216 (groupe B) 
4: Nl 9764 

5: Nm 8013 (groupe C) 
20 6: Ng MS11 

7: Nm 1912 (groupe A) 
8: Ng 4C1 

9: Nm 1121 ( non groupable) 
10: Ng FA1090 
25 11: Nc 32165 

12: Nm 7972 (groupe A). 

L'examen des Southern blots montre que les sequences 
contenues dans chaque banque sont specif iques de Nm et ne 
30 sont pas trouvees chez Nl. De plus, la reactivite 
observee avec les souches de Ng suggere que certaines de 
ces sequences sont presentes chez Ng. 

Chacune de ces banques a ensuite ete clonee dans 
pBluescript au site BamHI pour Bam, ou EcoRI pour Eco, ou 
35 Clal pour Cla. Afin de conf inner la specif icite des 
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clones vis-a-vis du genome de Nm, on a procede a une 
restriction des clones individuels et a leur 
radiomarquage. Les clones montrant a la fois une 
reactivite pour Nm et Ng ont ete conserves pour des 
5 etudes ulterieures . Ces clones sont representes sur les 
figures 9, 10 et 11, qui donnent les profils, vis-a-vis 
de Nm, Nl et Ng, de 5 clones de la banque Bam (figure 9), 
de 16 clones de la banque Eco (figure 10), et de 13 
clones de la banque Cla (figure 11). 
10 Ces clones ont ete sequences en utilisant des 

amorces universelles et inverses. II s ' agit 
des clones Bam 

Bll partiel de 140 pb ( SEQ ID N*66), B13 partiel estime a 
425 pb (SEQ ID N* 67), B26 de 181 pb (SEQ ID N * 68), B33 

15 de 307 pb (SEQ ID N* 69), B40 de 243 pb (SEQ ID N " 70), 
- des clones Cla 

C16 de 280 pb (SEQ ID N* 72), C20 partiel estime a 365 
pb (SEQ ID N* 73), C24 partiel estime a 645 pb 
(SEQ ID N* 74), C29 partiel estime a 245 pb (SEQ ID 

20 N* 75), C34 de 381pb (SEQ ID N'76), C40 de 269 pb (SEQ ID 
N* 77),C42 de 203 pb (SEQ ID N*78),p C43 de 229 pb (SEQ 
ID N' 79), C45 de 206 pb (SEQ ID N' 80),C47 de 224 pb 
(SEQ ID N' 81), C62 de 212 pb (SEQ ID N' 82), et C130 
(5'...) estime a 900 pb (SEQ ID N* 83), et 

25 - des clones Eco 

E2 de 308 pb (SEQ ID N* 84), E5 partiel, estime a 170 pb 
(SEQ ID N* 85), E22 partiel estime a 300 pb ^(SEQ ID 
N' 86), E23 de 273 pb (SEQ ID N # 87), E24 de 271 pb (SEQ 
ID N* 88), E29 de 268 pb (SEQ ID N* 89), E33 partiel, 

30 estime a 275 pb (SEQ ID N*90), E34 partiel, estime a 365 
pb (SEQ ID N* 91), E45 de 260 pb (SEQ ID N* 92), E59 
estimation superieure a 380 pb (SEQ ID N* 93), E78 de 308 
pb (SEQ ID N* 94), E85 de 286 pb (SEQ ID N* 95), E87 de 
238 pb (SEQ ID N* 96), E94 partiel, superieur a 320 pb 
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(SEQ ID N * 97), E103 partiel, superieur a 320 pb ( SEQ ID 
N* 98) et E110 de 217 pb (SEQ ID N # 99). 

La cartographie de chaque clone a ete effectuee sur 
le chromosome de Nm Z2491 en operant comme decrit dans 
l'exemple 2. Les resultats obtenus sont donnes sur la 
par-tie droite de la figure 2. On constate que ces clones 
correspondent aux regions appelees 4 et 5 . Ces regions 
sont done constitutes de sequences presentes a la fois 
chez Nm et chez Ng, mais non trouvees chez Nl. II est 
done considere qu'il s 1 agit de sequences codant pour des 
facteurs de virulence responsables de la colonisation 
initiale et de la penetration de la muqueuse. La region 4 
est localisee entre argF et regF sur le chromosome de Nm 
2491 et la region 5 entre le marqueur lambda 375 et penA. 
Cette region contient vraissemblablement des sequences 
codant pour un variant Opa et une proteine liant la 
transferrine. 

Une comparaison avec les sequences connues dans les 
banques de donnees a moitie que dans la region 4 seul le 
clone C130 presente une homologie, a savoir avec Mspl 
methylase. Dans la region 5, aucune homologie avec des 
sequences connues n'a ete trouvee avec les clones C8, E2, 
B40, C45, E23 et E103. Pour les autres clones, les 
homologies sont les suivantes : 

Bll arginine decarboxylase SpeA; C29 arginine 
decarboxylase SpeA; C62 oxoglutarate/malate 

transporteur; repetitive DNA element; E34 element 
repetitif d'ADN ; E94 endopeptidase MepA murine ; C47 
citrate synthase PrpC; E78 citrate synthase PrpC 

Sample 5 ; MiSft en e vi den ce de la presence d'unp 91 1 
PlUSieyrS ggwehes de Weisseria menin g itidis dans » r 
echantillon hinln<ji mi 

Un echantillon biologique de type liquide cephalo- 
rachidien, urine, sang, salive est preleve. 
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Apres filtration et extraction, les ADN presents 
dans cet echantillon sont soumis a electrophorese sur gel 
et transferes sur membrane par Southern blotting. 

Une sonde nucleotidique constitute par le marquage 
5 au 32 P de la SEQ ID n*5 est incubee avec cette membrane 
de transfert. 

Apres antoradiographie, la presence de bande(s) 
reactive(s) permet de diagnostiquer la presence de 
Neisseria meningitidis dans 1' echantillon. 

10 

Exemple £_j Composition vaccjnale — incluant — dans — son 

spectre une pr ophvlaxie a visee anti-meninqococcicrae et 
destinee a prevenir toute forme d' infection par Neisseria 
meningitidis, 

15 Le peptide code par une sequence incluant la SEQ ID 

n*10 est conjugue a une toxine. 

Ce peptide conjugue est alors ajoute a une 

composition comportant le vaccin anti -Haemophilus et 

anti-pneumocoque, ou tout autre vaccin de l'enfance. 
20 La composition resultante peut, apres avoir ete 

rendue sterile, etre injectee par voie parenterale, sous- 

cutanee ou intramusculaire. 

Cette meme composition peut egalement etre 

pulverisee au niveau des muqueuses a l'aide d'un spray. 

25 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



PCT/FR97/01295 



46 

LISTE DE SEQUENCES 



(1! INFORMATIONS GENERALES: 



CEPOSANT: 
( A ) NOM : I . N . S . E . R . M 
(3) RUE: 101. rue de Tolbiac 
(C) VILLE : PARIS CEDEX 13 
(E) PAYS: FRANCE 
(?) CODE POSTAL: 75654 



(ii) TITRE DE L' INVENTION : ADN. proteines et peptides soeciiicues des 
bactenes de i'espece Neisseria meningitidis, leurs precedes detention et 
leurs applications biologiques. 



i 1 i ) NCMHRE DE SEQUENCES : 9 9 

(iv) FORME DE CH I FFRABLE PAR ORDINATEUR : 
(A) TYPE DE SUPPORT: Floppy disk 
(3) ORDINATEUR : IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0. Version #1.30 (CE3) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(l) CARACTERISTigUES DE LA SEQUENCE: 

(A) LONGUEUR: 257 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
GATCCGCTGC CGGCAGACGA ATATCAAGAC ATCTTCGATT TTATGAAACA GTATGACTTG 
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TCTTACCCGT ATGAATATCT GCAGGATTGG ATAGATTACT ATACGTTCAA AACCGATAAG 120 
CTGGTATTTG G7AACGCGAA GCGAGAGTGA GCCGTAAAAC TCTGAGCTCG TGTTTTATAG 130 
ATTACAACTT TAGGCCG7CT TAAAGCTGAA AGATTTTCGA AAGCTATAAA TTGAAGCCGT 2 40 
TCCACAGTAC ATAGATC 25 7 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 276 pa ires de bases 

(B) TYPE: nucleotide 

(C) MOMBRE DE ERINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) CRIGINE : 

(A) ORGANISME : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



GATCATGTTC AAATAGATAG GCATGGGAAG CTGCAGCTCT AACGTCCATG AAAATATGTT 6 0 

GCATAGCTGC AAGCGGAA CG CCTTTTCTTT CATCTACATA ATCTATAGAG TCAAGGCAAC 120 

CGCTATTGAA ATTAGCAGTA TTGCCTATGA TTACATTAGT AATATGCTCA TACCATTTTT 180 

GGGTGGTCAT CATATTGTGC CCCATTGTrA TCTCCrrATA TTGGTTTTAG AAGGAACTTT 240 

GACAGGAAGA ATAACGGCCT TACCTGTTTG ACGATC 27 6 



(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 28 paires da bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS ; simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(vi) CRIGINE: 

(A! ORGANISMS: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(:<i) DESCRIPTICN DE LA SEQUENCE: SEQ ID NO: 3: 

GATCTGGTGG TGTTTGCACA GGTAGGCGCA TACTTGTTCG GGACTGAGTT TGCGGCGGAT 6 0 

AAGGGTGTCG ATGTGCTGAA TCAGCTGCGA ATCGAGCTTA TAGGGTTGTC GCTTACGCTG 120 

TTTGATAGTC C3GCTT7GCC GCTGGGCTTT TTCGGCGCTG TATTGCTGCC CTTGGGTGCG 180 

GTGCCGTCTG ATTTCGCGGC TGATGGTGCT TTTGTGGCGG TTAAGCTGTT TGGCGATTTC 24 0 

GGTGACGGTG CAGTGGCGGG ACAGGTATTG GATGTGGTAT CGTTCGCCTT GGGTCAGTTG 300 

CGTGTAGCTC ATGGCAATCT TTCTTGCAGG AAAGGCCGTA TGCTACCGCA TACTGGCCTT 360 

TTTCTGTTAG GGAAAGTTGC ACTTCAAATG CGAATCCGCC GACCTCTTTC AGTTACAGCA 4 20 
GCTTGATC 

428 

(2) INFORMATIONS POUR LA SEQ ID NO: 4 . 

(i) CARACTZRISTigUES DE LA SEQUENCE: 

(A) LONGUEUR: 390 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE ERINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYRE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

GATCCTGCAT TGACATCGGC CTTGGCTGTC AGGGTATTGT GACCGGTAAA GTCGGCATTA 60 

CCGTTGGCCA ATAAGGATAC ATGACCGTCT GCAGAAACAG CATGAAGGCC GTCTGAAACG 120 

ATATTGCCCT GCAATGCGGT GGTTTCGAGA GCCTTGGCTG CGTTCAGCTT GGTATTGCGA 180 

AGCTGAATAT TGCCTTTGGC TGCCTGAATG TGCAGATTAC CCGAGTTGGT ACGCAGATTG 240 
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GTATTGGTAA CATTCAGCAA GCCTGCCTCC ACACCCATGT CTTTTGAGGC AGTGAGGGTT 300 

TTACTGGTGC CGGTAATATG GGCAGCGTTA TCCGATTTCA AATGGATGCT GGCCGGCAGA 360 

CAAATCTT7A TCAACATTCA AATTCAGATC 3 90 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 177 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE : 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

GATCAGATTG GTGAAGACGG TATTACCGTC AATGTTGCAG GCCGTTCGGG ATATACGGCG 6 0 

AAAATCGACG TGTCTCCGAG TACCGATTTG GCGGTTTATG GCCATATTGA AGTTGTACGG 120 

GGTGCAACGG GGTTGACCCA ATCCAATTCA GAGCCGGGTG GAACCGTCAA TTTGATC 177 

(2) INFORMATIONS POUR LA SEQ ID NO : 6: 

(i) CARACrERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 341 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE : Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
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GATCAATGAT GCTACTATTC AAGCGGGCAG TTCCGTGTAC AGCTCCACCA AAGGCGATAC 6 0 

TGAATTGGGT GAAAATACCC GTATTATTGC TGAAAACGTA ACCGTATTAT CTAACGGTAG 120 

TATTGGCAGT GCTGC7GTAA TTGAGGCTAA AGACACTGCA CACATTGAAT CGGGCAAACC 130 

GCTTTCTTTA GAAACCTCGA CCGTTGCCTC CAACATCCG7 TTGAACAACG GTAACATTAA 2 40 

AGGCGGAAAG CAGCTTGCTT TACTGGCAGA CGATAACATT ACTGCCAAAA C7ACCAATCT 300 

GAATACTCCC GGCAATCTGT ATGTTCATAC AGGTAAAGA7 C 341 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 164 pa ires de bases 
(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE : 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

GATCCAACTG TTTGATTTTA CTGGCTGCTT CTCCATGCGC GGTATTGACC AAAGCCGCAA 60 

GGATATTCGC TTCCAGATTG TCTTTCAGGC TGCCGCCGTT GACAGCGGTA TTAATCAGTG 20 

CGGCACTGCC CGCATTGGCT AGGTTGACGG TCAGGTTGTT GATC 164 

(2) INFORMATIONS POUR LA SEQ ID NO : 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 219 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN [genomique) 
(vi) ORIGINE: 
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(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2-191 

(:<i) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 8: 

GATCAATCAC ACATCTTGTC ATTTTTTCGA TTCCTTCATT TCGGTTTCTA ATGTTTCAAT 6 0 

TCTTGCGGCC ATTTCCTGAA TGGCTTTAGT CAAAACGGGG ATGAACGCTT CGTATTCGAC 120 

GGTGTAGGTA TCGTTTGTTT TATTTACCAT CGGCAATCGA CCATATTCAT CTTCCAGCGC 180 

AGCAATGTCC TGGGCAATAA ACCAATGCCG CAACCGATC 219 
(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 356 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B] SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

GATCTTGGGT AAGCCCCCAA CCTGCATAGA AAGGCAGGCC GTAGCAGCTG ACTTTTTTGC 60 

CGCGCAACAA GGCTTCAAAA CCGGTCAGCG AAGTCATGGT ATGTATTTCG TCTGCGTATT 12 0 

GGAGACAGGT CAGGATGTCG GCTTGTTCGG CGGTTTGGTC GGCATATCGT GCAGCATCAT 180 

CAGGGGAAAT ATGGCCGATG CGGTTACCGC TGACTACATC GGGATGCGGT TTGTAGATGA 24 0 

TATAGGCATT GGGGTTTCGT TCGCGTACGG TACGGAGCAA ATCCAGATTG CGGTAGATTT 300 

GGGGCGAACC GTAGCGGATA GACGCATCAT CTTCAACCTG GCCGGGAACG AGGATC 356 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 210 pa ires de bases 
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(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CCN FIGURATION : lineal re 

(ID TYPE DE MOLECULE: ADN {genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SCUCHE : 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

GATCCGCTTT CAGTTTCCGT ACCGGTGGCA TCAGTCAAGT CCGTTTTGTG CACCAAACCG 6 0 

CGTCCATATG AAACATAAAA CAAATCGCTT AAGCCCAAAG GGTTATCGAA CGATAAAGC3 120 

ACATTTCCTT GATATTTGCC GGTCGTTTTG CCGCCCGCAT CATCTATACC GATACTGAAC 180 

CGTATGGGTT TATTCTGCTG CCATTTGATC 210 
( 2 ) INFORMATIONS POUR LA SEQ ID NO : 11: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 9 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) P/PE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
GATCCCGAAA CGCAATTGGT CGAAAGCTAT ATGCTGAACG ATGTGTTGCG GTTTTGGGAC 6 0 

AGCGCAGGTT TGGGCGATGG GAAAGAAGCC GACCGCGCCC ATCGGCAAAA ACTGATTGAT 120 

GTCCTGTCTA AAACCTATAC TCATTCGGAT GGGCAGTGGG GCTGGATAGA TTTGGTGTTC 180 

GTTATCCTTG ACGGCAGCTC CCGCGATTTG GGTACGGCCT ATGATTTGTT GAGGGATGTT 24 0 

ATCCTTAAAA TGATTGATC 259 
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(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 4 36 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE: 

(A) ORGAN IS ME : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

GATCAAATGG ATGATTTATA TAGAATTTTC TTTTACGACT GCGTGCCGTT TGAAAAGAAA 6 0 

ATGCACAATC CCGTATCTCA TCGTGCCATA GATTTTTCAA AGACTCCGGA AGCCATATTT 120 

CGTTGCAATC TGCATACCGA ATTGAAGAAG AAGCGTAAAT TAGCGTTACG TTTAGGCAAG 180 

CTGTCGGACA ATACAGCATG GATATTAAAA CCCCAAGTCA TGAAAAATCT TCTGAAAAAC 24 0 

CCGTCAACTC AAATTACGGA AAACGATGTC GTGCTCGATG TTAAACAAAA AGGTGTAGAT 300 

ATGCGTATAG GCTTGGATAT TTCATCTATT ACCTTAAAAA AACAAGCCGA TAAAATCATC 360 

TTGTTTTCTG GTGATTCCGA TTTTGTCCCA GCAGCCAAAT TAGCCAGACG GGAAGGTATC 4 20 

GATTTTATTC TTGATC 43 6 
(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 363 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
GATCGTTTTA CGTCGCAATC GAGCTTTGTG GTGCGCTCGC CTAAAAGCCA ATCTTCTCTC 6 0 
AATGGCCTGG GTGCCATTTT GCAGGGCACA GGTTTTGCCC GTGCGCAAGA CGATATTTAT 120 
ACCGTGCAGG AATATATGCA GTCGCGTTCG GCTTTGGATG CGTTGCGTAA GAAAATG CCC 130 
ATTCGCGATT TTTATGAAAA AGAAGGCGAT ATTTTCAG CC GTTTTAATGG TTTTGGCCTG 24 0 
CGTGGCGAGG ATGAGGCGTT TTATCAATAC TACCGTGATA AGGTATCCAT CCATTTTGAC 30 0 
TCTGTCTCAG GCATTTCCAA TTTGAGCGTT ACATCGTTTA ATGCCGGTGA ATCTCAAAAG 360 
ATC 

363 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 314 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineair© 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINS: 

(A) ORGAN I SHE : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

GATCTTGCGT CATTTATATC TTCACCGATA TTGCAATTAC CGCCGTTCCA GTTGAAATAA 6 0 

CAACGACTAA AATTGTAGTT CCTAAAAGAA TCATTCCTAT TCTTGCGTAC CATTTCCCAA 12 0 

TAATTGCGCC CGACAATTTC CATTTAATGC TCCATCAGTT CTTTTACTTC CGGAAATCTG 180 

CTGTAATCTG ACATAAGACG CATAATTGAA CTATCAACGC CGTAACAGCC ATAGGTTTTA 24 0 

ATACCGTTTT CGGCGTGTTC CCAAATGCAA TTACTGTATT CGTAGCCTTT TACAAATTTA 300 

TCGGTTTCGG GATC 3 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 256 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE ERINS: simple 

(D) CONFIGURATION: lineal re 

(n) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

GATCATACGA ATCTACCCTA AAATACCCCG TCGCCGATTT AGGATTGGCT ACATAAAGCT 6 0 

CATTATAAGG GTATTTTGAT GACATGATAC GGTTAAATTC ATTGCCGTTG TTTATCCTGA 120 

TTCTATAAAT TGGTTCAACA GCAAAGCCTC TGGATTCCCT TAATTGATTA TAATATTGCC 180 

TGTATGTTTG TACATCATGT CTTGTCCACG GCTCTCCAGG AGTCCTCAGA ATAGCAATCC 240 

CGTTAAATTT CGGATC 256 
(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

( l ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 235 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
GATCCACGCC TGTGCCTACC TTGGCTTTTT GTTCGCCAAA CAAGGCATTT AAGGTTGAGG 6 0 
ACTTGCCGAC ACCTGTCGCA CCGACAAGCA AGACATCCAA ATGACGGAAA CCGGCTGCTG 120 
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TGACTTTTTG CCCGATTTCA GAAATACGGT AACGATGCAT ATGCGCTCCT ACCAGCCAAA 13 0 
AAAAGAAGCA ACCGTGCTAA TCGCCCCTCC AATCGCTTTT GCAGCACCGC CGATC 235 
(2) INFORMATIONS POUR LA SEQ ID NO : 17: 

( 1 ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 259 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lmeaire 

(11) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE : 

(A) ORGANISME : Neisseria meningitidis 
(3) SCUC-E: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

GATCCAACGG GCATCGCTGT CCTTACTCGG TGTGGTTTGA CCGCTGATTT GTCCTTCTTC 60 

GTCAACTTCT ATGGCCTGAC GCTGTTTGCT GCCGGCGGTC TGGATAATGG TGGCATCAAC 120 

GACGGCGGCG GATGCTTTCT CTATTTTTAG GCCTTTTTCG GTCAGTTGGC AGTTAATCAG 180 

TTTGAGTAAT TCGGACAGGG TGTCGTCTTG CGCCAGCCAG TTGCGGTAGC GGCATAAGGT 2 40 

ACTGTAATCG GGGATGATC 259 

(2; INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 201 paires de bases 
CB) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 
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(Xi) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 18: 

GATCTGTGCC GTTGATTTTA TCTTTCAGAT GCAGCATCGA ATATCGGAAA GCCAAATCAG 6 0 

CAATTCTTTT TGCATCGTGT GGATTTTGAG ACGGGCCTAA TGACCGTACC CGCTTAATAA 120 

AAAATGCA CC GTCAATCAAA ATGGCGGTTT TCATATTGCT TCCCCTATAT TTGTCAAAGA 130 

TATAAAAAAG CCCTTGGGAT C 201 
(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 4 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

AATTCAAAGG AGGCATTTGT TGCAAGAAAA GTACAAAGTG ATTTGCAAAA AGCATTGAAT 6 0 

GCTAGCAACT ATAACAAGCA GCAATATGCA AGACGTGCGG CAACAGCGTT AGAGAATGCT 12 0 

TCAAAATCAA AAGTTATGGC AGCGAATTCT TTTTGATCTA TCTTGTGCGA ACGGGTCAAA 180 

TATTCTTCGT ACATTGAGTT AATCGTACCA ATCGCCCTAA CCACATTTTC ATCAGAAAAT 24 0 

ATGGAAATAA TAGCATCCCT ATACGCACCT AGTGTAATAT TGTTTCTATT ATTAGTTATA 300 

GCATTATTCG AATACATAAT AGCACCTCCA AATT 334 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 238 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 



FEUILLE DE REMPLACEMENT (REGLE 2$) 



WO 98/02547 



(11) TYPE DE MOLECULE : ADN ( q 



PCT/FR97/01295 



58 

jmique) 



(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 12491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20. 

AATTCCTGCG CACCTTTGCC GATGGGGAGA TAATCGCCTT TTTGCAGCAT TCTGCCCTGA 60 

TGGCCGCCGA AACCGGCTTT CAGGTCGGTA CTTCTCGAAC CCATCACTTC CGGCACATCA 120 

AATCCGCCCG CCACGCACAC ATAGCCGTAC ATGCCCTGCA CGGCACGCAC CAGTTTCAAG 180 

GTCTGCCCTT TGCGGGCGGT ATAACGCCAA TACGAATAGA CCGGTTCGCC GTCCAATT 238 
(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 249 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN ( genomique ) 

(vi) ORIGINS: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 

AATTGGGCGA GATGCTGCCG GAAACGGATT TAAAACAGAT TGCGGCGGCA GTGTTGAAGA 60 

CGAACGATGA GGCGGCATTG CAGAAGGTGG TGAAAACGGC CAAAGGCAAT GCGCGGAAAC 120 

TGTCGAAGCT GCTGCTGATT GTGGACTATT TGTTGCAGGT TAACCCTGAT GTTGATTTGG 180 

ATGATGATGT AATCGAACAC GCGGAAACCT ATTTAATCCA CTAAACCTTT GACAGATAAG 240 

GCAATAATT 24g 
(2) INFORMATIONS POUR LA SEQ ID NO: 22: 
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(1) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 212 pa ires de bases 

(B) TYPE: nucleotide 

(CI NOMERE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 

AATTTATGTA CGGTTTTGCC GTTTGCAGTC AGCCAGTCGG CAAGGCGCAG AAAAAAATCG 6 0 

CCGACAGGGC CTTGAAGCAG CAGGATATTT TCTGCGCTTT CAAGCAGGTT TTGCAGGTTA 12 0 

TTTTTGAGGA CGGTCTGTTT CATGTTGCAA TGTGGTTTTG TTTTTTATGT AATAGTTTTA 180 

GGTTGAACTT TCAAGCATAC GCCAAGAGAA TT 212 
(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 227 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE : 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 

AATTCAGTGC CTGCGTCATA TCACGGCTAC CTTGTGGTTC AGGGTTACTG TATCGCCCGC 60 

GGCATCGACG GCTTCAATAT GCAGCTTCAG CCAGCCGTGC TGCGGGGCGG ATGCGGTTAC 120 

TTGGATGGAT TGGGCGCGTT TGGACTGAAT CACGGGCTGC AAGGCTTGCT CGGCGTACTG 18 0 

TTTGGCCAGT ACTTCGATGC GCTTTAAATG CTTTTGGCGG CGCAATT 227 
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(2) INFORMATIONS POUR LA SEO ID NO: 24: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 167 pa ires de bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BR INS : simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN IS ME : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 24: 
GATCCAGGAC TCAAAAACCG ATTTCCTAAT AGAGTGTCTA ATATCCCAAT CTTTTTT ACC 6 0 
CCCTCTGCTG TAGAATTGAT AGAGAAAGTT TGTCTATCTT TTTCATATAC CCATGCCTTC 120 
TTTTTATCAT TGTAGCTAAC ATAACCGCCA AACAATGCTT CTAGATC 167 
(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 251 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

AATTCTTGCG GCCATTTCCT GAATGGCTTT AGTCAAAACG GGGATGAACG TTTCGTATTC 6 0 

GACGGTGTAG GTATCGTTTG TTTTATTTAC CATCGGCAAT CGACCATATT CATCTTCCAG 120 

CGCAGCAATG TCCTGGGCAA TAAACCAATG CCGCAACCGA TCTTCTTTAT GACTGCCGTC 180 
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CTTGATTGGA TTCGCCCACC ATTCGCGGAC TTTGTCCGCT CGTTCATCTG CGGGCAAGTC 2-10 



TTTGAATAAT T 251 
(2) INFORMATIONS POUR LA SEQ ID NO : 26: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 207 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN I SHE : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 

AATTCCCGAC TATCGCGGAT GCGTAGTTTT TGCCGGTGGG CAAGAGCAGG TGTGGGATAA 60 

GTTAGGTGAT TTGCCCGATG GCGTCAGCCT GACCCCGCCT GAATCGGTAA ATATTGACGG 120 

CTTAAAATCC GTAAAACTCG TCGCATTAAA TGCTGCCGCT CAGG CTTTT A TTAACAAGCA 180 

CGCCGGTATC GACAGCGTAC CTGAATT 207 
(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 379 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE : 

(A) ORGANISME : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 
AATTGTTTGG GAATAATCCA AACAAACAGC ATCAGGATAG CGGCGGCGGT CAGGCTGCCT 6 0 
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GAAAGGATTT TGCCGGGGTT TTTTGTAGGC AAAGCGGACG AGAAACCAAA GCAACAGCAG 120 

CATGGTGTCC CAATAGCCGA TTGAGAATAG GATGGCCAAA CCTTCTAGGA AATGGCGTAA 130 

ATCGTTTGTG GTAACCATGG GTAGTTCCTG TGGTTAAATG TGCAGGCTGC TTTTTGCCGA 2-10 

ACCTTGCCGC ATCTCAAAAG CAGCCTGCGC TTCAGCGTTG CGTTACGCAG TAAAATAATG 3 00 

AATATTTGTA ACGGCTTGGG TATTTTTTGT CAATATTCCC GCCCTTCCCT TAACAGCTGC 3 60 

CGCGCTTTCC GTTAAAATT 379 
(2) INFORMATIONS POUR LA SEQ ID NO : 28: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 274 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g6nomique} 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 28: 

AATTCGCCGA AATCAGGCTG CTGCTCGATA ATCGGCGCGG CCGATTGGCG TTGTGCCTCG 6 0 

ATTAAATCCA TCTTGTCTTG CAGACGTTTG GCCTGGCCTT TGCGGCGGCG TTCGGCCAGT 120 

TGTTCCATCC GCGTTTCCGC AAATGCCGCC CGTTTGTTGC CGTTGAATAC CGCTTTGCAA 180 

ATCACCTTGC CCTGCATATC CTTCACAATC ACATGGTCGG CATCGTGGAT GTCGTAAGCC 240 

ACCCGTACCT TCTGACCGCT GTAATCCAGC AATT 27 4 
(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 263 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
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(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

AATTCCGTTC TTATTGGGCT TTTTCCATCC ATCGGGTATG CCTGAAGGGA ACGCAAACCC 6 0 

TGCCACTTGC CCATCGCTCC ATTCCCGCAT TAGCGCGTCT GACGGCAAGT GTTCTCGCGC 120 

CCAATCAAGC CACGCCTGCC GCATTGCGGC CTTGTCCTGC TGAAAACTTC GCAGTGCTTT 180 

TGCAACCGGC CCATCATTAA CTTCAATCAA ATAAATCATT ATATTTGCGT TCATTTTTCC 2 40 

TACACCTTCG CCACATCCAA ATT 26 3 

(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTigUES DE LA SEQUENCE : 

(A) LONGUEUR: 316 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 

AATTGTTCAA GAAAAAAGTC GGCACGGCGC GGCAACGGGG AAAATGCGTT GACGCCGTCT 60 

TTTTCTAAGG TGATGTAGTA GGGGCGGAAA TAGCCTTCTT CAAACGCCCA GAAACTGGCT 120 

TGGTTTTCGT TTGCAATGCG TTTTGCAATG ACGTGATAAG GGCGTGTGTC GCCAAAGCAG 180 

ACAACGGCCT GGATGTGATG TTGAGTGATG TATTCTTGCA AAAACTCAGG AAAGGCGTCG 24 0 

TAGTTGTCGT TAAAAACAAC GGTATGCGCT TGAGTGGGCG GATAAAAATA GTCGTCGCCT 3 00 
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GCATTAAAGT TGAATT 316 
(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 324 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN I SHE : Neisseria meningitidis 

(B) SOUCHE: Z2491 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 31: 

AATTCAATCA ACGGAAAACA CATCAGCATC AAAAACAACG GTGGTAATGC CGACTTAAAA 60 

AACCTTAACG TCCATGCCAA AAGCGGGGCA TTGAACATTC ATTCCGACCG GGCATTGAGC 120 

ATAGAAAATA CCAAGCTGGA GTCTACCCAT AATACGCATC TTAATGCACA ACACGAGCGG 180 

GTAACGCTCA ACCAAGTAGA TGCCTACGCA CACCGTCATC TAAGCATTAC CGGCAGCCAG 24 0 

ATTTGGCAAA ACGACAAACT GCCTTCTGCC AACAAGCTGG TGGCTAACGG TGTATTGGCA 300 

CTCAATGCGC GCTATTCCCA AATT 32 4 
(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 230 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 
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(xi) DESCRIPTION EE LA SEQUENCE: SEQ ID MO: 32: 

AATTATGCAA AAAAACGCAA CGCCGAAAAA CTGGCACCGC GCGGATATTG TTGCTGCTTT 6 0 

GAAAAAGAAA GGCTGGTCAC TTCGAGCACT TTCAATAGAA GCGGGGTTGT CGCCGAATAC 120 

GCTTAGAAGC GCACTGGCCG CCCCTTATCT TAAGGGAGAA AGGATTATTG CCGCTGCAAT 130 

CGGAGTGGAA CC3GAAGAGA TTTGGTCC3A ACGGTATGCA GATCGGAATT 230 

(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 249 pa ires tie bases 
(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS : simple 

(D) CCNFIGURATICN : lineal re 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi] CRIGIME : 

(A) ORGANISMS: Neisseria meningitidis 
(31 SCUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

AATTTAATCG GTGGAATGCC TGTTCAACCG CACCAATCCC GCTGAATACG GTTGCTAATC 6 0 

TAATATGTGA ATCAGGTTTA AGAAAAGTTT TAGATTTCCA ACCTTGTTGA CTGGGAAAGA 120 

GCAAAGTTTT TTGTAATCGA GTATCGTGTG TCTGTGCCAT TGTCGAAATA GTCATACTTA 18 0 

TATCGTTCTG TTTATCTTAT CAATATGAAA ACTACATCGT TGATTGCCCT GACAATGCCT 240 

TGGTCAATT 24 9 

(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 343 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CCNFIGURATICN : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE. 12 4 91 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3-1: 

AATTCTTGTC CCGGAGTCCA ACGTATATTT ACCCTCCTGC GAGCTAAAAG ACTATTATTC 6 0 

TCCACTGCCA CAGTAGCCGC ATTCACCGCC GTATTCACAT CCCCTTTAAC CAATGCCACT 120 

GCGCTGCCTG CGATAATCTG CGAGTAGGCT ATGACTTTTT GGCGTTCTTG GGGTGACAGT 180 

TTGCCTACAT CGCGTCCGTC CAACAGGGTT TCTCCCACCA TCTCGCCGAC TGCCGCGCCG 240 

ATTGCGCCGT CCCGACATTT GCCTTTATTT GCTXCCGCCG ATGCACAGCC TGCTACGGCA 3 00 

TGGGCTATCT TGTGGGCAAT GTAGTCTTCG CTGAGATTAA ATT 34 3 

(2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 18 4 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 35: 

AATTCTTCAA ACATCGTTTC GATAATCGGG TCGGTGTACA CACTGATGCG GTCGCCCGCA 60 

CGGCTTTGAC CGGCTCGGAA AATATAGGCG GTGGCTTTGC CGTCGGCGAT GTCGACGCAC 120 

CAACGCCAGA TGGCGTCTTC GGTATTCAAA CAATCACCCG CACAGCTTTC ACCTGCGCGG 180 

AATT 184 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
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TATGCTCAAT CTCATTTTCA AAATGCAAAA CTTTTCTGAT TTTTCCTACT TTTTGCTCAA 6 0 

TATTAGGAAG GTTTTAGGCA ATTGAAAATT TTTTGGCGCA TTTTTATGCG TCAAATTTCG 120 

TTAACAGACT ATTTTTGCAA AGGTCTCCGT CTGTAAAAGC AAGGATAGGG CATCTGCCCT ISO 

TTTGATTGTT TGATTAACGA TACAAGGAGT TTCAAAATGA GAGTTTTATA GTGGATTAAC 2-iO 

AAAAACCAGT ACAGCGTTGC CTCGCCTTGC CGTACTATTT G7ACTGTCTG CGGCTTCGTC 300 

GCCTTGTCCT GATTTAAATT TAATCCACTA TATGTGTTCA TGAAATGACT TGGGTCGGAG 360 

GCTCAGGTAA TGCGCAACAA AGTTCATATT ATTGCGAAAT TTGCGAATCT GCAGGGCTTA 4 20 

ACGATACGGG AAATCCTGAT AAATCTTTAG GATTGCCAAA CAATACGTTC AGTAATCCGC 480 

CTGGTTGGGG AGCTACAATC GGAGCTTTAG CAGGTAGCCG CATAGGTATG CCTGAATTTG 540 

GTACGTTTGC GAGCCATGCC ATTGAAAATT TCGACTGGTC ATGGTATCGA CGTTATAGGG 6 00 

AAATTGCCGA AACGATTGAA CGAGAATATT CAGGCGGTTT GCCTTAATAG TTGAGGAGGT 6 60 

CATGATGTTT GCCAAACATT ATCAATTCAT CGCACTCGGC ATCATGCTGC TTCTTTATAT 720 

GTTGATTCTC TATACGACCG ATTTTTCCAA TCTGACGTAT TGGATGCTGT TTTTTATCTG 7 80 

TTTTATTACA GGAAAAATAT TAGCTCGTTT GTTAGAGAAA AGCTTTAAAT AAAATAGCAG 84 0 

CTAGTCGCAA AAGGTCGTCT GAAACCTTTT CAGGCGGCCT TTCTAAAATA CATCCAACTT 900 

CCTAATCCCT ATTTTTCAAA AAGGAAATCT ATGCCCCATC TGCAAAACCT GTCTTTGGGC 96 0 

TTAAAGAAAA AGCTGCCTGT TATCCTGCAA ACAGAAATAT CAGAATGCGG CTTGGCATGT 1020 

CTGGCGGCTG TGGCGGGATT TCATGGTTTC CATACGAATT TACGCGCACT GCGTTCAAAA 1080 

TACTGTCCGA GACCTTTGCA AAATTCCCCA AAATCCCCTA AATGTCTTGG TGGGAATTTT 1140 

GGGGAATTTT GCAAAGGTCT CATTCTATAA CTGTAAATAC TTTTAAATTT ATGACAAAAT 1200 

AGTAAATATT GCTAAAATAA TATTGATGTC ATGAAATTTT TTCCTGCTCC ATGTCTGTTG 126 0 

GTTATCCTGG CTGTCATACC CCTTAAAACC TTAGCTGCCG ATGAAAACGA TGCAGAACTT 1320 

ATCCGTTCCA TGCAGCGTCA GCAGCACATA GATGCTGAAT TGTTAACTGA TGCAAATGTC 13 30 
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CGTTTCGAGC AACCATTGGA GAAGAACAAT TATGTCCTGA G7GAAGATGA AACACCGTGT 14 40 

ACTCGGGTAA ATTACATTAG TTTAGA7GAT AAGACGGCGC GCAAATTTTC TTTTCTTCCT 1500 

TCTGTGCTCA TGAAAGAAAC AGCTTTTAAA ACTGGGATGT GTTTAGGTTC CAATAATTTG 156 0 

AGCAGGCTAC AAAAAGCCGC GCAACAGATA CTGATTGTGC GTGGCTACCT CACTTCCCAA 16 20 

GCTATTATCC AACCACAGAA TATGGATTCG GGAATTCTGA AATTACGGGT ATCAGCAGGC 1680 

GAAATAGGGG ATATCCGCTA TGAAGAAAAA CGGGATGGGA AGTCTGCCGA GGGCAGTATT 174 0 

AGTGCATTCA ATAACAAATT TCCCTTATAT AGGAACAAAA TTCTCAATCT TCGCGATGTA 1800 

GAGCAGGGCT 7GGAAAACCT GCGTCGTTTG CCGAGTGTTA AAACAGATAT TCAGATTATA 186 0 

CCGTCCGAAG AAGAAGGCAA AAGCGATTTA CAGATCAAAT GGCAGCAGAA TAAACCCATA 19 20 

CGGTTCAGTA TCGGTATAGA TGATGCGGGC GGCAAAACGA CCGGCAAATA TCAAGGAAAT 1980 

GTCGCTTTAT CGTTCGATAA CCCTTTGGGC TTAAGCGATT TGTTTTATGT TTCATATGGA 20 4 0 

CGCGG7TTGG TGCACAAAAC GGACTTGACT GATGCCACCG GTACGGAAAC TGAAAGCGGA 2100 

TCCAGAAGTT ACAGCGTGCA TTATTCGGTG CCCGT AAAAA AATGGCTGTT TT CTTTT AAT 2160 

CACAATGGAC ATCGTTACCA CGAAGCAACC GAAGGCTATT CCGTCAATTA CGATTACAAC 222 0 

GGCAAACAAT ATCAGAGCAG CCTGGCCGCC GAGCGCATGC TTTGGCGTAA CAGGTTTCAT 22 8 0 

AAAACTTCAG TCGGAATGAA ATTATGGACA CGCCAAACCT ATAAATACAT CGACGATGCC 23 4 0 

GAAATCGAAG TGCAACGCCG CCGCTCTGCA GGCTGGGAAG CCGAATTGCG CCACCGTGCT 2 400 

TACCTCAACC GTTGGCAGCT TGACGGCAAG TTGTCTTACA AACGCGGGAC CGGCATGCGC 24 6 0 

CAAAGTATGC CCGCACCTGA AGAAAACGGC GGCGGTACTA TTCCAGGCAC ATCCCGTATG 2520 

AAAATCATAA CCGCCGGATT GGATGCAGCG GCCCCGTTTA TGTTGGGCAA ACAGCAGTTT 258 0 

TTCTACGCAA CCGCCATTCA AGCTCAATGG AACAAAACGC CTTTGGTTGC CCAAGACAAG 2640 

TTGTCTATCG GCAGCCGCTA CACCGTTCGC GGATTTGATG GGGAGCAGAG TCTTTTCGGA 2700 
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GAGCGAGG77 TCTAC7GGCA GAATACTTTA ACTTGGTATT TTCATCCGAA CCATCAGTTC 27 60 

TATCTCGGTG CGGACTATGG CCGCGTATCT GGCGAAAGTG CACAATATGT ATCGGGCAAG 23 2 0 

CAGCTGATGG GTGCAGTGGT CGGCTTCAGA GGAGGGCATA AAGTAGGCGG TATGTTTGCT 2 3 30 

TATGATCTGT TTGCCGGCAA GCCGCTTCAT AAACCCAAAG GCTTTCAGAC GACCAACACG 2 9-40 

GTTTACGGCT TCAACTTGAA TTACAGTTTC TAACCTCTGA ATTTTT7TAC TGATATTTAG 30 00 

ACGGTCTTTC CTTATCCTCA GACTGTCAAA CT7TACCTAC GTACTTGGCG CGCAGTACGT 30 60 

TCATCTTCAA AATGGAATAG ACATGAATAA AGGTTTACAT CGCATTATCT TTAGTAAAAA 3120 

GCACAGCACC ATGGTTGCAG TAGCCGAAAC TGCCAACAGC CAGGGCAAAG GTAAACAGGC 318 0 

AGGCAGTTCG GTTTCTGTTT CACTGAAAAC TTCAGGCGAC CTTTGCGGCA AACTCAAAAC 3 2 40 

CACCCTTAAA ACCT7GGTCT GCTCTTTGGT TTCCCTGAGT ATGGTATTGC CTGCCCATGC 3 300 

CCAAATTACC ACCGACAAAT CAGCACCTAA AAACCAGCAG GTCGTTATCC TTAAAACCAA 3 3 60 

CACTGGTGCC CCGTTGGTGA ATATCCAAAC TCCGAATGGA CGCGGATTGA GCCACAACCG 34 20 

CTATACGCAG TTTGATGTTG ACAACAAAGG GGCAGTGTTA AACAACGACC GTAACAATAA 3 480 

TCCGTTTCTG GTCAAAGGCA GTGCGCAATT GATTTTGAAC GAGGTACGCG GTACGGCTAG 3 54 0 

CAAACTCAAC GG CATCGTTA CCGTAGGCGG TCAAAAGGCC GACGTGATTA TTGCCAACCC 3600 

CAACGGCATT ACCGTTAATG GCGGCGGCTT TAAAAATGTC GGTCGGGGCA TCTTAACTAT 3 6 60 

CGGTGCGCCC CAAATCGGCA AAGACGGTGC ACTGACAGGA TTTGATGTGC GTCAAGGCAC 3 720 

ATTGACCGTA GGAGCAGCAG GTTGGAATGA TAAAGGCGGA GCCGACTACA CCGGGGTACT 37 8 0 

TGCTCGTGCA GTTGCTTTGC AGGGGAAATT ACAGGGTAAA AACCTGGCGG TTTCTACCGG 384 0 

TCCTCAGAAA GTAGATTACG CCAGCGGCGA AATCAGTGCA GGTACGGCAG CGGGTACGAA 3900 

ACCGACTATT GCCCTTGATA CTGCCGCACT GGGCGGTATG TACGCCGACA GCATCACACT 3 960 

GATTGCCAAT GAAAAAGGCG TAGGCGTCAA AAATGCCGGC ACACTCGAAG CGGCCAAGCA 402 0 

ATTGATTGTG ACTTCGTCAG GCCGCATTGA AAACAGCGGC CGCATCGCCA CCACTGCCGA 4 080 
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CGGCACCGAA GC7TCACCGA CTTA7CTCTC CATCGAAACC ACCGAAAAAG GAGCGGCAGG 4140 

CACATTTATC TCCAATGG7G GTCGGATCGA GAGCAAAGGC TTATTGGTTA TTGAGACGGG 4 2 00 

AGAAGATATC AGCTTGCGTA ACGGAGCCGT GGTGCAGAAT AACGGCAGTC GCCCAGCTAC 4 2 60 

CACGGTATTA AATGCTGGTC ATAA7TTGGT GATTGAGAGT AAAACTAATG TGAACAATGC 4 3 20 

CAAAGGCTCG GCTAATCTGT CGGCCGGCGG TCGTACTACG ATCAATGATG CTACTATTCA 438 0 

AGCGGGCAGT TCCGTGTACA GCTCCACCAA AGGCGATACT GAATTGGGTG AAAATACCCG 4 4 40 

TATTATTGCT GAAAACGTAA CCGTATTATC TAACGGTAGT ATTGGCAGTG CTGCTGTAAT 4 5 00 

TGAGGCTAAA GACACTGCAC ACATTGAATC GGGCAAACCG CTTTCTTT AG AAACCTCGAC 4 560 

CGTTGCCTCC AACATCCGTT TGAACAACGG TAACATTAAA GGCGGAAAGC AGCTTGCTTT 4 6 20 

ACTGGCAGAC GATAACATTA CTGCCAAAAC TACCAATCTG AATACTCCCG GCAATCTGTA 4 680 

TGTTCATACA GGTAAAGATC TGAATTTGAA TGTTGATAAA GATTTGTCTG CCGCCAGCAT 4 740 

CCATTTGAAA TCGGATAACG CTGCCCATAT TACCGGCACC AGTAAAACCC TCACTGCCTC 4 8 00 

AAAAGACATG GGTGTGGAGG CAGGC7TGCT GAATGTTACC AATACCAATC 7GCGTACCAA 4860 

CTCGGGTAAT CTGCACATTC AGGCAGCCAA AGGCAATATT CAGCTTCGCA ATACCAAGCT 4 920 

GAACGCAGCC AAGGCTCTCG AAACCACCGC ATTGCAGGGC AATATCG7TT CAGACGGCCT 4 980 

TCATGCTGTT TCTGCAGACG GTCATGTATC CTTATTGGCC AACGGTAATG CCGACTTTAC 5 040 

CGGTCACAAT ACCCTGACAG CCAAGGCCGA TGTCAATGCA GGATCGGTTG GTAAAGGCCG 5100 

TCTGAAAGCA GACAATACCA ATATCACTTC ATCTTCAGGA GATATTACGT TGGTTGCCGG 5160 

CAACGGTATT CAGCTTGGTG ACGGAAAACA ACGCAATTCA ATCAACGGAA AACACATCAG 5220 

CATCAAAAAC AACGGTGGTA ATGCCGACTT AAAAAACCTT AACGTCCATG CCAAAAGCGG 5 280 

GGCATTGAAC ATTCATTCCG ACCGGGCATT GAGCATAGAA AATACCAAGC TGGAGTCTAC 5 3 40 

CCATAATACG CATCTTAATG CACAACACGA GCGGGTAACG CTCAACCAAG TAGATGCCTA 54 00 
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CGCACACCGT CATCTAAGCA TTACCGGCAG CCAGATTTGG CAAAACGACA AACTGCCTTC 5 4 60 

TGCCAACAAG CTGGTGGCTA ACGGTGTATT GGCACTCAAT GCGCGCTATT CCCAAAT7GC 55 20 

CGACAACACC ACGCTGAGAG CGGGTGCAAT CAACCTTACT GCCGGTACCG CCCTAGTCAA 5 58 0 

GCGCGGCAAC ATCAATTGGA GTACCGTTTC GACCAAGACT TTGGAAGATA ATGCCGAATT 56 40 

AAAACCATTG GCCGGACGGC TGAATATTGA AGCAGGTAGC GGCACATTAA CCATCGAACC 5700 
TGCCAACCGC ATCAGTGCGC ATACCGACCT GAGCATCAAA ACAGGCGGAA AATTGCTGTT " 5 7 60 

GTCTGCAAAA GGAGGAAATG CAGGTGCGCC TAGTGCTCAA GTTTCCTCAT TGGAAGCAAA 5820 

AGGCAATATC CGTCTGGTTA CAGGAGAAAC AGATTTAAGA GGTTCTAAAA TTACAGCCGG 58 8 0 

TAAAAACTTG GTTGTCGCCA CCACCAAAGG CAAGTTGAAT ATCGAAGCCG TAAACAAC7C 59 40 

ATTCAGCAAT TATTTTCCTA CACAAAAAGC GGCTGAACTC AACCAAAAAT CCAAAGAATT 60 0 0 

GGAACAGCAG ATTGCGCAGT TGAAAAAAAG CTCGCCTAAA AGCAAGCTGA TTCCAACCCT 6060 

GCAAGAAGAA CGCGACCGTC TCGCTTTCTA TATTCAAGCC ATCAACAAGG AAGTTAAAGG 6120 

TAAAAAA CCC AAAGGCAAAG AATACCTGCA AGCCAAGCTT TCTGCACAAA ATATTGACTT 6180 

GATTTCCGCA CAAGGCATCG AAATCAGCGG TTCCGATATT ACCGCTTCCA AAAAACTGAA 624 0 

CCTTCACGCC GCAGGCGTAT TGCCAAAGGC AGCAGATTCA GAGGCGGCTG CTATTCTGAT 63 00 

TGACGGCATA ACCGACCAAT ATGAAATTGG CAAGCCCACC TACAAGAGTC ACTACGACAA 63 6 0 

AGCTGCTCTG AACAAGCCTT CACGTTTGAC CGGACGTACG GGGGTAAGTA TTCATGCAGC 64 20 

TGCGGCACTC GATGATGCAC GTATTATTAT CGGTGCATCC GAAATCAAAG CTCCCTCAGG 6 480 

CAGCATAGAC ATCAAAGCCC ATAGTGATAT TGTACTGGAG GCTGGACAAA ACGATGCCTA 654 0 

TACCTTCTTA AAAACCAAAG GTAAAAGCGG CAAAATCATC AGAAAAACCA AGTTTACCAG 6600 

CACCCGCGAC CACCTGATTA TGCCAGCCCC CGTCGAGCTG ACCGCCAACG GTATCACGCT 666 0 

TCAGGCAGGC GGCAACATCG AAGCTAATAC CACCCGCTTC AATGCCCCTG CAGGTAAAGT 672 0 

TACCCTGGTT GCGGGTGAAG AGCTGCAACT GCTGGCAGAA GAAGGCATCC ACAAGCACGA 6 780 
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GTTGGATGTC CAAAAAAGCC GCCGCTTTAT CGGCATCAAG GTAGGTAAGA GCAATTACAG 6 8 4 0 

TAAAAACGAA CTGAACGAAA CCAAATTGCC TGTCCGCG7C GTCGCCCAAA C7GCAGCCAC 6 9 00 

CCGTTCAGGC TGGGATACCG TGCTCGAAGG TACCGAAT7C AAAACCACGC TGGCCGGTGC 6 9 60 

CGACATTCAG GCAGGTGTAG GCGAAAAAGC CCGTGTCGAT GCGAAAATTA TCCTCAAAGG 70 20 

CATTGTGAAC CGTATCCAGT CGGAAGAAAA ATTAGAAACC AACTCAACCG TATGGCAGAA 7 080 

ACAGGCGGGA CGGGGCAGCA CTATCGAAAC GCTAAAACTG CCCAGCTTCG AAAGCCCTAC 7140 

TCCGCCCAAA TTGTCCGCAC CCGGCGGCTA TATCGTCGAC ATTCCGAAAG GCAATCTGAA 7 2 00 

AACCGAAATC GAAAAGCTGT CCAAACAGCC CGAGTATGCC TATCTGAAAC AGCTCCAAGT 7 2 60 

AGCGAAAAAC ATCAACTGGA ATCAGGTGCA GCTTGCTTAC GACAGATGGG ACTACAAACA 7 3 20 

GGAGGGCTTA ACCGAAGCAG GTGCGGCGAT TATCGCACTG GCCG7TACCG TGGTCACCTC 7380 

AGGCGCAGGA ACCGGAGCCG TATTGGGATT AAACGGTGCG GCCGCCGCCG CAACCGATGC 7440 

AGCATTCGCC TCTTTGGCCA GCCAGGCTTC CGTATCGTTC ATCAACAACA AAGGCGATGT 750 0 

CGGCAAAACC CTGAAAGAGC TGGGCAGAAG CAGCACGGTG AAAAATCTGG TGGTTGCCGC 75 6 0 

CGCTACCGCA GGCGTAGCCG ACAAAATCGG CGCTTCGGCA CTGAACAATG TCAGCGATAA 7620 

GCAGTGGATC AACAACCTGA CCGTCAACCT AGCCAATGCG GGCAGTGCCG CACTGATTAA 76 8 0 

TACCGCTGTC AACGGCGGCA GCCTGAAAGA CAATCTGGAA GCGAATATCC TTGCGGCTTT 77 40 

GGTCAATACC GCGCATGGAG AAGCAGCCAG TAAAATCAAA CAGTTGGATC AGCACTACAT 7 800 

AGTCCACAAG ATTGCCCATG CCATAGCGGG CTGTGCGGCA GCGGCGGCGA ATAAGGGCAA 7860 

GTGTCAGGAT GGTGCGATAG GTGCGGCTGT GGGCGAGATA GTCGGGGAGG CTTTGACAAA 7 920 

CGGCAAAAAT CCTGACACTT TGACAGCTAA AGAACGCGAA CAGATTTTGG CATACAGCAA 7 980 

ACTGGTTGCC GGTACGGTAA GCGGTGTGGT CGGCGGCGAT GTAAATGCGG CGGCGAATGC 804 0 

GGCTGAGGTA GCGGTGAAAA ATAATCAGCT TAGCGACAAA GAGGGTAGAG AATTTGATAA 8100 
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CGAAATGACT GCATGCGCCA AACAGAATAA TCCTCAACTG TGCAGAAAAA ATACTGTAAA 3160 

AAAGTATCAA AATGTTGCTG ATAAAAGACT TGCTGCTTCG ATTGCAATAT GTACGGATAT 8 22 0 

ATCCCGTAGT ACTC-AATGTA GAACAATCAG AAAACAACAT TTGATCGATA GTAGAAGCCT 8 2S0 

TCATTCATCT TGGC-AAGCAG G7CTAATTGG TAAAGATGAT GAATGGTA7A AATTATTCAG 8 3 4 0 

CAAATCTTAC ACCCAAGCAG ATTTGGCTTT ACAGTCTTAT CATTTGAATA CTGCTGCTAA 3 400 

ATCTTGGCTT CAATCGGGCA A7ACAAAGCC TTTATCCGAA TGGATGTCCG ACCAAGGTTA 8 4 60 

TACACTTATT TCAGGAGTTA ATCCTAGATT CATTCCAATA CCAAGAGGGT TTGTAAAACA 8 5 20 

AAATACACCT ATTACTAATG 7CAAATACCC GGAAGGCATC AGTTTCGATA CAAACCTAAA 858 0 

AAGACATC7G GCAAA7GC7G A7GG7777AG 7CAAGAACAG GGCA77AAAG GAGCCCA7AA 8 640 

CCGCACCAA7 777A7GGCAG AAC7AAA77C ACGAGGAGGA CGCG7AAAA7 C7GAAACCCA 8 7 00 

AAC7GA7A77 GAAGGCA77A CCCGAA77AA A7A7GAGA77 CC7ACAC7AG ACAGGACAGG 8760 

7AAACC7GA7 GG7GGA777A AGGAAATT7C AAGTATAAAA ACTGTTTA7A A7CCTAAAAA 8 820 

A7TTTC7GA7 GA7AAAA7AC 77CAAA7GGC 7CAAAA7GC7 GC77CACAAG GA7AT7CAAA 8 880 

AGCCTC7AAA A77GC7CAAA A7GAAAGAAC 7AAA7CAA7A 7CGGAAAGAA AAAA7G7CA7 894 0 

7CAA77C7CA GAAACC777G ACGGAA7CAA A777AGA7CA 7A7777GA7G 7AAA7ACAGG 9 000 

AAGAA77ACA AACATTCACC CAGAA7AA77 7AAAGGAAAA A77A7GAAAA A7AA7A7777 9 0 60 

7C7AAAC77A AA7AAAAAA7 C7A7AAA7AA CAACCA7TT7 GT7A777CGA 77777777GA 9120 

AACAA777AC CAA777GAAA C7AAAGA7AC GC7T7TAGAG 7G77T7AAAA A7A7TACAAC 9180 

7ACCGGACA7 777GGAG7AA 7AGG7GC7CA A7A7GAAAAA ATAGA7GC7A CCAGA7GGA7 9 2 40 

7GGAGA7TA7 GAAGAGG7AA A7GGA77TGA GTATATTGAT AAAGC7CC77 CTA77TA7TT 9300 

77CAG77GGA GA7GA777CA ATCC7GAAGA ATTAATTATA CCTA77AA77 7AGCA7A7CA 9 3 60 

77AC777AA7 A77GCAA7A7 C7GA777C77 AATAGCTCAC CC7GAATA7C AAAAAAAG7G 94 20 

7AAAGAAA7A CAAAAAACA7 A77C7CAAAC AAAC7G7AGC C7GCA7GAAA CCTAAAA7CC 9 480 
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ATGCGTAAGG TGTGTGCTTC AGCACGCACG CGTTCCATGA TTTACGGCTC AATGCCGTCT 95-10 

GAAAAGCTCA CAATTTTTCA GACGGCATTT GTTATGCAAG TAAATATTCA GATTCCCTAT 9600 

ATACTGCCCA GACGCGTGCG TGCTGAAGAC ACCCCCTACG CTTGCTGCAG AACTTTCGGG 9660 

TAAAACCGGT GTGAGCATTA GCGCACCGTA TGCCAATGAG AACAGTCGCA TCCTGCTCAG 9 7 20 

CACCACGGAT ATCAGTTCGG AAAACGGCAA AATCAAAATT CAATCTTACG GTGACCAATA 9780 

TTACTATGCG AGACAGAGCG AACTCTATAC CTTTGAACGC CGCAGCTACA AAACTGGCAA 9840 

ATGGTACAAC CGCAAACACA TTACCGAAGT CAAAGAACAC AAAAACGCCA AGCCCGACGC 9 90 0 

AGTAAACCTC AGCGCATCCC AAGGCATCGA CATCAAATCT GGTGGCAGCA TCGACGCCTA 9960 

CGCCACCGCA 7TCGATGCCC CCAAAGGCAG CATTAACATC GAAGCCGGGC GGAAATTGAC 10020 

ACTCTATGCC GTAGAAGAGC TCAACTACGA CAAACTAGAC AGCCAAAAAA GGCGCAGATT 10080 

TCTCGGCATC AGCTACAGCA AAGCACACGA CACCACCACC CAAGTCATGA AAACCGCGCT 10140 

GCCCTCAAGG GTAGTTGCAG AATCAGCCAA CCTCCAATCG GGCTGGGATA CCAAACTGCA 10200 

AGGCACACAG TTTGAAACCA CACTGGGTGG CGCAACCATA CGCGCAGGCG TAGGTGAGCA 1026 0 

GGCACGGGCA GATGCCAAGA TTATCCTCGA AGGGATCAAA AGCAGCATCC ACACAGAAAC 10320 

CG7GAGCAGC AGCAAATCTA CTCTATGGCA AAAACAGGCA GGACGGGGCA GTAACATCGA 10380 

AACCTTGCAA TTGCCGAGTT TCACCGGTCC CGTTGCGCCC GTACTGTCCG CACCCGGCGG 10440 

TTACATTGTC GACATTCCGA AAGGCAATCT GAAAACCCAA ATCGAAACCC TCACCAAGCA 10500 

GCCCGAGTAT GCTTATTTGA AACAACTTCA AGTTGCGAAA AACATCAACT GGAATCAGGT 105 60 

GCAGCTTGCT TACGATAAAT GGGACTACAA ACAGGAGGGC ATGACACCCG CAGCAGCAGC 10620 

TGTCGTCGTT ATCGTCGTAA CCGTATTGAC CTACGGTGCA CTGTCCGCCC CGGCAGCCGC 1068 0 

CGGAACGGCG GGCGCGGCAG GCGCAGGAGC GGGAGGAGCC GCAGCAGGAA CGGCAGCCGG 10740 

AACTGGAGTA GCAGCAGGAA CGGCAGCCAC AACCGGAGTA GCAGCAGGCA CATCAGCTGC 10800 
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AGCTATCACC ACAGCCGCAG GCAAAGCCGC ACTGGCCAGT CTCGCCAGCC AAGCCGCAGT 108 6 0 

TTCCCTCATC AACAACAAAG GAGACATAAA CCATACCCTG AAAGAACTGG GCAAAAGCAG 109 20 

CACCGTCAGA CAGGCCGCCA CCGCCGCCGT AACCGCAGGC GTACTGCAGG GCATAAGCGG 109 80 

GCTGAACACC CAAGCAGCCG AAGCCGTCAG CAAACATTTT CACAGTCCCG CAGCAGGCAA 110-10 

ACTGACCGCT AACCTGATCA ACAGCACCGC TGCCGCAAGT GTCCATACCG CCATCAACGG 11100 

CGGCAGCCTG AAAGACAACT TGGGCGATGC CGCACTGGGT GCGATAGTCA GTACCGTACA 11160 

CGGAGAAGTA GCGAGCAAAA TCAAATTTAA TCTCAGCGAA GACTACATTG CCCACAAGAT 11220 

AGCCCATGCC GTAGCAGGCT GTGCATCGGC GGTAGCAAA7 AAAGGCAAAT GTCGGGACGG 11280 

CGCAATCGGC GCGGCAGTCG GCGAGATGGT GGGAGAAACC CTGTTGGACG GACGCGATGT 11340 

AGGCAAACTG TCACCCCAAG AACGCCAAAA AGTCATAGCC TACTCGCAGA TTATCGCAGG 11400 

CAGCGCAGTG GCATTGGTTA AAGGGGATGT GAATACGGCG GTGAATGCGG CTACTGTGGC 114 60 

AGTGGAGAAT AATAG7CTTT TAGCTCGCAG GAGGGTAAAT ATACGTTGGA CTCCGCGACA 11520 

AGAATTGGAA CATGAATATG CCAT7CTTGA AATCCAGGCC ATTACCAATC AAATCCGAAG 11580 

GCTGGATCCG AAATTTAACG GGATTGCTAT TCTGAGGACT CCTGGAGAGC CGTGGACAAG 11640 

ACATGATGTA CAAACATACA GGCAATATTA TAATCAATTA AGGGAATCCA GAGGCTTTGC 11700 

TGTTGAACCA A7TTATAGAA TCAGGATAAA CAACGGCAAT GAATTTAACC GTATCATGTC 11760 

ATCAAAATAC CCTTATAATG AGCTTTATGT AGCCAATCCT AAATCGGCGA CGGGGTATTT 11820 

TAGGGTAGAT TCGTATGATC CTGCGACAAG GGAAATTATT TCAAGAAAAT TTACCCAATT 11880 

TTCTCAAATC GXAGAAAGTA CGGGGATTGG TTATATCAAG GAGGCTGTTA GAAAATATAG 11940 

CCCTGGTACT GTCATTTCCA ATGTTCCAAG TACACCTACT ACGATAAGAG GAAGAAAGCT 120 00 

TGAAGGAAAA CT7ATTTTAG AAGTTCCTGC TCAGGTCAAT CCAATTCCAC AATCTGTATT 120 60 

AAGGGCGGCA CAAGAAGAAA ATGTTATCA7 TAGAGATACA ACAGGAAGGA TTTACAAATG 12120 

AAGAAAGATA TTTTTTATTG TGAGCAGTGG TCTTATGGTT ATAAGAGACT TCATAAGCCT 12180 
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TTTTCTGAGA AACAAGCTGA GGAAAAACAT CTTAAAGGGG AGTTATATAC TGCCGTAATA 12240 

GGTTCGGCGA CACAACCTGA ATATGTAATT ACCTTGCGAG AGGAAGTAGG TTTTTTTTCG 123 00 

GTAAATTTTT TCGATAAATT TGGAAGGGAT TATTTAACCC ATCAATTTCA AAAATATTCG 12360 

AATTCGAATT ATTATTTTCT TTCTATGGCT GTATGGAGAG ATTATATAAC TTTGGAATCT 12420 

CATGACTTAG CAGAAGGATA TACTTATTTC TTCAATGAAA ATACGGATGA TTGCTATGTT 12480 

TTGAAACAAG ATTTTATTAA TAATGAGCGA TATGAAAAAA CAGAATTATA TTCCCAAAAA 12540 

GATAAGGTAA TTCTATTTCC AAAGTTTGGT GAATATGATT TGGTGTTAAA TCCGGACA7T 12 600 

ATTTAATTAA GTTTTAAGGC CGTCTGAAAA AAATTTCAAA CGGCTTTTAT TATTGGGTT7 12660 

GGAATCTGAG GATAAAGCTG ATAAAAACCA GGAAATTATC AGATTGCTAT ATACGTATTG 12720 

TTGTACAGAC TAAAGGCAGC AATCAAATCA CTATTGCTTA CCCACAAAAA TAAATTGATT 12 780 

ATATGGAATA ATCATGAATA AGAGAATGAA AATGTGTCCT GCTTGTCAAC AAGGCTATCT 128 4 0 

CTACCATTCG AAACCTAAAT ATCTTCATGA TGAAATTATT CTGTGTGATG AATGCGATGC 12900 

AGTATGGCTC AAAGGTATGA ATATATTTTA TGGAGAATAT GAAAAAGATT TTTATTCTTA 12960 

TGTTCCTTTC ATGGAATCCC AAGGTATAAC GAGTGAATGT ATTTGGGAAG GAGATTTGTT 13020 

TGATCATCCA TATTATGAAG ATGAAAACTC AAATGATATG GATTGATGGA AATTTTAAGC 13 080 

CTGCGTAGGT ACGATTAGCC ATCAAACGGC GTAATCATAC GCAAGATTAT CAACAGAGAG 13140 

GG CTGGCAGC GATATACCAC CCACAAGATT GCCCATGCCA TAGCGGGCTG TGCGGCAGCG 13 200 

GCGGCGAATA AGGGCAAGTG TCAGGATGGT GCGATAGGCG CTGCAGTCGG TGAGATTGTT 13260 

GGTGAGGCTT TGGTTAAGAA TACTGATTTC AGTCGTATGA GTGCGACCGA AATCGAAAAA 13320 

GCTAAAGCGA AGATTACTGC CTATTCAAAA CTGGTTGCCG GCACTGCGTC TGCCGTTGTA 13 380 

GGCGGGGATG TGAATACAGC GGCGAATGCG GCACAGATAG CGGTGGAGAA TAATACTTTG 13 440 

TATCCTAGAT GCGTTGGTGC AAAGTGTGAT GAATTTCAAA AGGAACAACA AAAATGGATA 13 500 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 PCT/FR97/01295 

77 

CGTGAAAATC CTGAAGAATA TCGAGAAGTT TTGCTTTTTC AGACAGGATT TATTCCAATT 13 560 

ATCGGTGATA TACAGAGTTT TGTACAAGCA CAGACCGCTG CCGATCACCT GTTTGCTTTG 13 620 

CTGGGTGTGG TTCCGGGTAT CGGTGAATCG ATACAGGCCT ATAAAGTAGC GAAAGCGGCA 13680 

AAAAATTTAC AAGGCATGAA AAAAGCCTTG GACAAGGCAG CAACCGTTGC CACTGCACAG 13 7-J0 

GGCTATGTCA GCAAAACCAA AATCAAAATC GGTCAAACTG AATTAAGGGT TACTGCAGCA 13800 

ACTGACAAAC AATTGCTGAA AGCTATTGGC GAAGGAAGGG ACACGACAGG TAAAATGACC 138 60 

GAGCAGTTAT TTGACTCTT7 AGCTAAACAA AATGGCTTCA GAGTGCTTTC GGGCGGCAAA 13920 

TACGGCGGAA ATAACGGTTT TGATCATGTA TGGCAGGCTG CCGATGGTAG TGTCGTTTTG 1398 0 

ATTGTAGAAA GTAAGCAGA7 TAGGAACGGT ACGGTACAGC TGAATCCGAA TGGTG CGGGT 1404 0 

GGATATACGC AAATGAGTGA GGATTGGATT AGACAAGTTT TAGATCAATT ACCCGATGGT 14100 

AGTCCCGCTA AAGC7GCTG7 CTTCAAAGCA AATAAGAACG GCACATTAAA AACAGCAATA 14160 

GCAGGCGTTG ATCGTCAAAC AGGTAAGGCC GTTATTCTTC CTGTCAAAGT TCCTTCTAAA 14220 

ACCAATATAA GGAGATAACA ATGGGGCACA ATATGATGAC CACCCAAAAA TGGTATGAGC 14 280 

ATATTACTAA TGTAATCATA GG CAATACTG CTAATTTCAA TAGCGGTTGC CTTGACTCTA 14 3 40 

TAGATTATGT AGATGAAAGA AAAGGCGTTC CGCTTGCAGC TATGCAACAT ATTTTCATGG 14 400 

ACGTTAGAGC TGCAGCTTCC CATGCCTATC TATTTGAACA TGATCTTAAG AAATTCAAGC 14460 

AATATGCTTA TGTTGCAGGA AAGCTGGGGG TTTTGCTGAG TGTAAATTCT ACAGACCCTG 14520 

AACCCTTCTT CTTTCCCTGT GACATGCTCA ACATTCAAAA TCCGATGTTT CTGATGCTGA 14580 

TGAGCGACAG CCCACAGCTG CGTGAGTTTC TGGTGCGCAA TATCGACAAC ATCGCCAACG 14 640 

ATACAGAAGC CTTTATAAAC CGCTACGACC TCAACCGGCA TATGATTTAC AATACTCTGC 14 700 

TGATGGTGGA GGGTAAGCAG CTTGATCGGT TGAAACAACG TAGCGAGAAA GTCTTGGCGC 14760 

ATCCCACCCC TAGCAAATGG CTGCAAAAGC GGTTGTACGA TTACCGCTTC TTCCTCGCTT 14 820 

TCGCCGAACA GGATGCCGAG GCAATGAAAG CCGCCTTAGA GCCGCTTTTC GATAAAAAAA 14880 
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CCGCGCGTAT GC-CTGCCAAA GAAACATTGT CCTATTTCGA TTTCTACCTG CAGCCGCAAA 149 40 

TCGTTACCTA CGCCAAAATC GCATCCATGC ACGGTTTCGA TTTGGGCATA GATCAAGAAA 15000 

TCTCACCGAG GGATTTGATT GTTTACGATC CGCTGCCGGC AGACGAATAT CAAGACATCT 15060 

TCGATTTTAT GAAACAGTAT GACTTGTCTT ACCCGTATGA ATATCTGCAG GATTGGATAG 15120 

ATTACTATAC GTTCAAAACC GATAAGCTGG TATTTGGTAA CGCGAAGCGA GAGTGAGCCG 15180 

TAAAACTCTG AGCTCCTGTT TTATAGATTA CAACTTTAGG CCGTCTTAAA GCTGAAAGAT 1524 0 

TTTCGAAAGG TATAAATTGA AGCCCTTCCA CAGTACATAG ATCTGTGTTG TGGCGGGGCT 15300 

TTACCACGCT GATTGCCGGA GAAGAACTCA ACCTGGTGGC AAAACAAGGC ATGAGATCTT 15 3 60 

TGCAATAACA TGAGTTGAGA CGTTTGCAAA AAAGCCCTTC CCCGACATCC GAAACCCAAA 15420 

CACAGGATTT CGGCTGTTTT CGTACGAAAT ACCTCCTAAT TT7ACCCAAA TACCCCCTTA 154 80 

ATCCTCCTCG GACACCCGAT AATCAGGCAT CCGGGCTGCC TTTTAGGCGG CAGCGGGCGC 15540 

ATTTAGCCTG TTGGCCGCTT TCAACAGGTT CAAACACATC GCCTTCAGGT GGCTTTGCGC 15 600 

ACTCACTTTG TCATTTCCAA 15620 

(2) INFORMATIONS POUR LA SEQ ID NO: 37: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 580 acides amines 
(3) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(IX) CARACTERISTICUE : 

(A) NOM/CLE: Protein 

(B) EMPLACEMENT: 1. .580 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 

Met Lys Phe Phe Pro Ala Pro Cys Leu Leu Val He Leu Ala Val He 
15 10 15 
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Pro Leu Lys Thr Leu Ala Ala Asp Glu Asn Asp Ala Glu Leu He Arg 
20 25 30 

Ser Met Gin Arg Gin Gin His He Asp Ala Glu Leu Leu Thr Asp Ala 
35 -to 45 

Asn Val Arg Phe Glu Gin Pro Leu Glu Lys Asn Asn Tyr Val Leu Ser 
50 55 60 

Glu Asp Glu Thr Pro Cys Thr Arg Val Asn Tyr He Ser Leu Asp Asp 
65 70 75 80 

Lys Thr Ala Arg Lys Phe Ser Phe Leu Pro Ser Val Leu Met Lys Glu 



Thr Ala Phe Lys Thr Gly Met Cys Leu Gly Ser Asn Asn Leu Ser Arg 
100 105 HO 

Leu Gin Lys Ala Ala Gin Gin He Leu He Val Arg Gly Tyr Leu Thr 
115 120 125 

Ser Gin Ala He He Gin Pro Gin Asn Met Asp Ser Gly He Leu Lys 
130 135 140 

Leu Arg Val Ser Ala Gly Glu He Gly Asp He Arg Tyr Glu Glu Lys 
145 150 155 160 

Arg Asp Gly Lys Ser Ala Glu Gly Ser He Ser Ala Phe Asn Asn Lys 
165 170 175 

Phe Pro Leu Tyr Arg Asn Lys He Leu Asn Leu Arg Asp Val Glu Gin 
180 185 190 

Gly Leu Glu Asn Leu Arg Arg Leu Pro Ser Val Lys Thr Asp He Gin 
195 200 205 

He He Pro Ser Glu Glu Glu Gly Lys Ser Asp Leu Gin He Lys Trp 
210 215 220 

Gin Gin Asn Lys Pro He Arg Phe Ser He Gly He Asp Asp Ala Gly 
225 230 235 240 

Gly Lys Thr Thr Gly Lys Tyr Gin Gly Asn Val Ala Leu Ser Phe Asp 
245 250 255 
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Asn Pro Lau Gly Lau Ser Asp Leu Phe Tyr Val Sar Tyr Gly Arg Gly 
260 265 270 

Leu Val His Lys Thr Asp Lau Thr Asp Ala Thr Gly Thr Glu Thr Glu 
2" 230 235 

Sar Gly Sar Arg Sar Tyr Ser Val His Tyr Ser Val Pro Val Lys Lys 
290 295 300 

Trp Leu Phe Sar Phe Asn His Asn Gly His Arg Tyr His Glu Ala Thr 
305 310 315 320 

Glu Gly Tyr Ser Val Asn Tyr Asp Tyr Asn Gly Lys Gin Tyr Gin Ser 
325 330 335 

Ser Leu Ala Ala Glu Arg Met Leu Trp Arg Asn Arg Phe His Lys Thr 
340 345 350 

Ser Val Gly Met Lys Leu Trp Thr Arg Gin Thr Tyr Lys Tyr lie Asp 
355 360 365 

Asp Ala Glu lie Glu Val Gin Arg Arg Arg Ser Ala Gly Trp Glu Ala 



Glu Leu Arg His Arg Ala Tyr Leu Asn Arg Trp Gin Leu Asp Gly Lys 
385 3 ?0 395 ' 400 

Leu Ser Tyr Lys Arg Gly Thr Gly Met Arg Gin Ser Met Pro Ala Pro 
405 410 415 

Glu Glu Asn Gly Gly Gly Thr lie Pro Gly Thr Ser Arg Met Lys He 



He Thr Ala Gly Leu Asp Ala Ala Ala Pro Phe Met Leu Gly Lys Gin 
435 440 445 

Gin Phe Phe Tyr Ala Thr Ala He Gin Ala Gin Trp Asn Lys Thr Pro 
450 455 460 

Leu Val Ala Gin Asp Lys Leu Ser He Gly Ser Arg Tyr Thr Val Arg 



Gly Phe Asp Gly Glu Gin Ser Leu Phe Gly Glu Arg Gly Phe Tyr Trp 
485 490 495 
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Gin Asn Thr Leu Thr Trp Tyr Phe His Pro Asn His Gin Phe Tyr Leu 
500 505 510 

Gly Ala Asp Tyr Gly Arg Val Ser Gly Glu Ser Ala Gin Tyr Val Ser 
515 520 525 

Gly Lys Gin Leu Met Gly Ala Val Val Gly Phe Arg Gly Gly His Lys 
530 535 540 

Val Gly Gly Met Phe Ala Tyr Asp Leu Phe Ala Gly Lys Pro Leu His 
545 550 555 560 

Lys Pro Lys Gly Phe Gin Thr Thr Asn Thr Val Tyr Gly Phe Asn Leu 
565 570 575 

Asn Tyr Ser Phe 

580 

INFORMATIONS POUR LA SEQ ID NO: 38: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1981 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(li) TYPE DE MOLECULE: peptide 



( ix ) CARACTERISTIQUE : 

(A) NCM/CLE : Peptide 

(B) EMPLACEMENT : 1 . .1981 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 38: 

Met Asn Lys Gly Leu His Arg He He Phe Ser Lys Lys His Ser Thr 
15 10 15 

Met Val Ala Val Ala Glu Thr Ala Asn Ser Gin Gly Lys Gly Lys Gin 
20 25 30 

Ala Gly Ser Ser Val Ser Val Ser Leu Lys Thr Ser Gly Asp Leu Cys 
35 40 45 
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Gly Lys Lau Lys Thr Thr Leu Lys Thr Leu Val Cys Ser Leu Val Ser 
50 55 60 

Leu Ser Met Val Leu Pro Ala His Ala Gin He Thr Thr Asp Lys Ser 
55 70 75 ' go 

Ala Fro Lys Asn Gin Gin Val Val He Leu Lys Thr Asn Thr Gly Ala 
85 90 95 

Pro Leu Val Asn He Gin Thr Pro Asn Gly Arg Gly Leu Ser His Asn 
100 105 no 

Arg Tyr Thr Gin Phe Asp Vai Asp Asn Lys Gly Ala Val Leu Asn Asn 
115 120 125 

Asp Arg Asn Asn Asn Pro Phe Leu Val Lys Gly Ser Aia Gin Leu He 
130 135 140 

Leu Asn Glu Val Arg Gly Thr Ala Ser Lys Leu Asn Gly He Val Thr 
145 150 155 i 60 

Val Gly Gly Gin Lys Ala Asp Val He He Ala Asn Pro Asn Gly He 
165 170 175 

Thr Val Asn Gly Gly Gly Phe Lys Asn Val Gly Arg Gly He Leu Thr 
180 185 190 

He Gly Ala Pro Gin He Gly Lys Asp Gly Ala Leu Thr Gly Phe Asp 
195 200 205 

Val Arg Gin Gly Thr Leu Thr Val Gly Ala Ala Gly Trp Asn Asp Lys 
210 215 220 

Gly Gly Ala Asp Tyr Thr Gly Val Leu Aia Arg Ala Val Ala Leu Gin 
225 230 235 240 

Gly Lys Leu Gin Gly Lys Asn Leu Ala Val Ser Thr Gly Pro Gin Lys 
245 250 255 

Val Asp Tyr Ala Ser Gly Glu He Ser Ala Gly Thr Ala Ala Gly Thr 



Lys Pro Thr He Ala Leu Asp Thr Ala Ala Leu Gly Gly Met Tyr Ala 
275 280 285 
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Asp Ser He Thr Leu He Ala Asn Glu Lys Gly Val Gly Val Lys Asn 
290 295 300 

Ala Gly Thr Lau Glu Ala Ala Lys Gin Leu He Val Thr Ser Ser Gly 
305 310 315 320 

Arg He Glu Asn Ser Gly Arg lie Ala Thr Thr Ala Asp Gly Thr Glu 
325 330 335 

Ala Ser Pro Thr Tyr Leu Ser He Glu Thr Thr Glu Lys Gly Ala Ala 
340 345 350 

Gly Thr Phe He Ser Asn Gly Gly Arg lie Glu Ser Lys Gly Leu Leu 
355 360 365 

Val He Glu Thr Gly Glu Asp He Ser Leu Arg Asn Gly Ala Val Val 
370 375 380 

Gin Asn Asn Gly Ser Arg Pro Ala Thr Thr Val Leu Asn Ala Gly His 
385 390 395 ' 400 

Asn Leu Val He Glu Ser Lys Thr Asn Val Asn Asn Ala Lys Gly Ser 
405 410 415 

Ala Asn Leu Ser Ala Gly Gly Arg Thr Thr He Asn Asp Ala Thr He 
420 425 430 

Gin Ala Gly Ser Ser Val Tyr Ser Ser Thr Lys Gly Asp Thr Glu Leu 
435 440 445 

Gly Glu Asn Thr Arg lie lie Ala Glu Asn Val Thr Val Leu Ser Asn 
450 455 460 

Gly Ser He Gly Ser Ala Ala Val lie Glu Ala Lys Asp Thr Ala His 
465 470 475 480 

lie Glu Ser Gly Lys Pro Leu Ser Leu Glu Thr Ser Thr Val Ala Ser 
485 490 495 

Asn lie Arg Leu Asn Asn Gly Asn He Lys Gly Gly Lys Gin Leu Ala 
500 505 510 

Leu Leu Ala Asp Asp Asn lie Thr Ala Lys Thr Thr Asn Leu Asn Thr 
515 520 525 
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Pro Gly Asn Leu Tyr Val His Thr Gly Lys Asp Leu Asn Leu Asn Val 
530 535 540 

Asp Lys Asp Leu Ser Ala Ala Ser He His Leu Lys Ser Asp Asn Ala 
5-15 550 555 560 

Ala His lie Thr Gly Thr Ser Lys Thr Leu Thr Ala Ser Lys Asp Met 
565 570 575 

Gly Val Glu Ala Gly Leu Leu Asn Val Thr Asn Thr Asn Leu Arg Thr 
580 585 590 

Asn Ser Gly Asn Leu His He Gin Ala Ala Lys Gly Asn lie Gin Leu 
595 600 605 

Arg Asn Thr Lys Leu Asn Ala Ala Lys Ala Leu Glu Thr Thr Ala Leu 
510 615 620 

Gin Gly Asn He Val Ser Asp Gly Leu His Ala Val Ser Ala Asp Gly 
625 630 635 640 

His Val Ser Leu Leu Ala Asn Gly Asn Ala Asp Phe Thr Gly His Asn 
645 650 655 

Thr Leu Thr Ala Lys Ala Asp Val Asn Ala Gly Ser Val Gly Lys Gly 
660 665 670 

Arg Leu Lys Ala Asp Asn Thr Asn He Thr Ser Ser Ser Gly Asp He 
675 680 685 

Thr Leu Val Ala Gly Asn Gly He Gin Leu Gly Asp Gly Lys Gin Arg 
690 695 700 

Asn Ser He Asn Gly Lys His He Ser He Lys Asn Asn Gly Gly Asn 
705 710 715 720 

Ala Asp Leu Lys Asn Leu Asn Val His Ala Lys Ser Gly Ala Leu Asn 
725 730 735 

He His Ser Asp Arg Ala Leu Ser He Glu Asn Thr Lys Leu Glu Ser 
740 745 750 



Thr His Asn Thr His Leu Asn Ala Gin His Glu Arg Val Thr Leu Asn 
755 760 765 
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Gin Val Asp Ala Tyr Ala His Arg His Leu Ser He Thr Gly Ser Gin 
770 775 780 

He Trp Gin Asn Asp Lys Leu Pro Ser Ala Asn Lys Leu Val Ala Asn 
785 790 795 800 

Gly Val Leu Ala Leu Asn Ala Arg Tyr Ser Gin He Ala Asp Asn Thr 
805 810 815 

Thr Leu Arg Ala Gly Ala He Asn Leu Thr Ala Gly Thr Ala Leu Val 
820 825 830 

Lys Arg Gly Asn He Asn Trp Ser Thr Val Ser Thr Lys Thr Leu Glu 
835 840 845 

Asp Asn Ala Glu Leu Lys Pro Leu Ala Gly Arg Leu Asn He Glu Ala 
850 855 860 

Gly Ser Gly Thr Leu Thr He Glu Pro Ala Asn Arg He Ser Ala His 
865 870 875 880 

Thr Asp Leu Ser He Lys Thr Gly Gly Lys Leu Leu Leu Ser Ala Lys 
885 890 895 

Gly Gly Asn Ala Gly Ala Pro Ser Ala Gin Val Ser Ser Leu Glu Ala 
900 905 910 

Lys Gly Asn He Arg Leu Val Thr Gly Glu Thr Asp Leu Arg Gly Ser 
915 920 925 

Lys He Thr Ala Gly Lys Asn Leu Val Val Ala Thr Thr Lys Gly Lys 
930 935 940 

Leu Asn He Glu Ala Val Asn Asn Ser Phe Ser Asn Tyr Phe Pro Thr 
945 950 955 960 

Gin Lys Ala Ala Glu Leu Asn Gin Lys Ser Lys Glu Leu Glu Gin Gin 
965 970 975 

He Ala Gin Leu Lys Lys Ser Ser Pro Lys Ser Lys Leu He Pro Thr 
980 985 990 

Leu Gin Glu Glu Arg Asp Arg Leu Ala Phe Tyr He Gin Ala He Asn 
995 1000 1005 
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Lys Giu Val Lys Gly Lys Lys Pro Lys Gly Lys Glu Tyr Leu Gin Ala 
1010 1015 1020 

Lys Leu Ser Ala Gin Asn lie Asp Leu He Ser Ala Gin Gly He Glu 
1025 1030 1035 1040 

He Ser Gly Ser Asp He Thr Ala Ser Lys Lys Leu Asn Leu His Ala 
1045 1050 1055 

Ala Gly Val Leu Pro Lys Ala Ala Asp Ser Glu Ala Ala Ala lie Leu 
1060 1065 1070 

He As? Gly He Thr Asp Gin Tyr Glu He Gly Lys Pro Thr Tyr Lys 
107 5 1080 1085 

Ser His Tyr Asp Lys Ala Aia Leu Asn Lys Pro Ser Arg Leu Thr Gly 
1090 1095 U00 

Arg Thr Gly Val Ser lie His Ala Ala Ala Ala Leu Asp Asp Ala Arg 
1105 U10 ins U20 

He He He Gly Ala Ser Glu He Lys Ala Pro Ser Gly Ser lis Asp 
1125 H30 1135 

He Lys Ala His Ser Asp He Val Leu Glu Ala Gly Gin Asn Asp Ala 
1140 H45 1150 

Tyr Thr Phe Leu Lys Thr Lys Gly Lys Ser Gly Lys He He Arg Lys 
1155 1160 U65 

Thr Lys Phe Thr Ser Thr Arg Asp His Leu He Met Pro Ala Pro Val 

H70 H75 H80 

Glu Leu Thr Ala Asn Gly He Thr Leu Gin Ala Gly Gly Asn He Glu 
1185 U90 H95 1200 

Ala Asn Thr Thr Arg Phe Asn Ala Pro Ala Gly Lys Val Thr Leu Val 
1205 1210 1215 

Ala Gly Glu Glu Leu Gin Leu Leu Ala Glu Glu Gly He His Lys His 
1220 1225 1230 



Glu Leu Asp Val Gin Lys Ser Arg Arg Phe He Gly He Lys Val Gly 
1235 1240 1245 
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Lys Ser Asn Tyr Ser Lys Asn Glu Leu Asn Glu Thr Lys Leu Pro Val 
1250 1255 1260 

Arg Val Val Ala Gin Thr Ala Ala Thr Arg Ser Giy Trp Asp Thr Val 
1265 1270 1275 1280 

Leu Glu Gly Thr Glu Phe Lys Thr Thr Leu Ala Gly Ala Asp lie Gin 
1285 1290 1295 

Ala Gly Val Gly Glu Lys Ala Arg Val Asp Ala Lys He lie Leu Lys 
1300 1305 1310 

Gly He Val Asn Arg He Gin Ser Glu Glu Lys Leu Glu Thr Asn Ser 
1315 1320 1325 

Thr Val Trp Gin Lys Gin Ala Gly Arg Gly Ser Thr He Glu Thr Leu 
1330 1335 1340 

Lys Leu Pro Ser Phe Glu Ser Pro Thr Pro Pro Lys Leu Ser Ala Pro 
1345 1350 1355 1360 

Gly Gly Tyr He Val Asp He Pro Lys Gly Asn Leu Lys Thr Glu He 
1365 1370 1375 

Glu Lys Leu Ser Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
1380 1385 1390 

Val Ala Lys Asn He Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Arg 
1395 1400 1405 

Trp Asp Tyr Lys Gin Glu Gly Leu Thr Glu Ala Gly Ala Ala He He 
1410 1415 1420 

Ala Leu Ala Val Thr Val Val Thr Ser Gly Ala Gly Thr Gly Ala Val 
1425 1430 1435 1440 

Leu Gly Leu Asn Gly Ala Ala Ala Ala Ala Thr Asp Ala Ala Phe Ala 
1445 1450 1455 

Ser Leu Ala Ser Gin Ala Ser Val Ser Phe He Asn Asn Lys Gly Asp 
1460 1465 1470 

Val Gly Lys Thr Leu Lys Glu Leu Gly Arg Ser Ser Thr Val Lys Asn 
1475 1480 1485 
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Leu Val Val Ala Ala Ala Thr Ala Gly Val Ala Asp Lys He Gly Ala 
1-190 1495 1500 

Ser Ala Leu Asn Asn Val Ser Asp Lys Gin Trp He Asn Asn Leu Thr 
1505 1510 1515 1520 

Val Asn Leu Ala Asn Ala Gly Ser Ala Ala Leu He Asn Thr Ala Vai 
1525 1530 1535 

Asn Gly Gly Ser Leu Lys Asp Asn Leu Glu Ala Asn He Leu Ala Ala 
1540 1545 1550 

Leu Val Asn Thr Ala His Gly Glu Ala Ala Ser Lys He Lys Gin Leu 
1555 1560 1565 

Asp Gin His Tyr lie Val His Lys He Ala His Ala He Ala Gly Cys 
1570 1575 1580 

Ala Ala Ala Ala Ala Asn Lys Gly Lys Cys Gin Asp Gly Ala He Gly 
I 585 1590 1595 1600 

Ala Ala Val Gly Glu He Val Gly Glu Ala Leu Thr Asn Gly Lys Asn 
1605 1610 1615 

Pro Asp Thr Leu Thr Ala Lys Glu Arg Glu Gin He Leu Ala Tyr Ser 
1620 1625 1630 

Lys Leu Val Ala Gly Thr Val Ser Gly Val Val Gly Gly Asp Val Asn 
1635 1640 1645 

Ala Ala Ala Asn Ala Ala Glu Val Ala Val Lys Asn Asn Gin Leu Ser 
1650 1655 1660 

Asp Lys Glu Gly Arg Glu Phe Asp Asn Glu Met Thr Ala Cys Ala Lys 
1665 1670 1675 1680 

Gin Asn Asn Pro Gin Leu Cys Arg Lys Asn Thr Val Lys Lys Tyr Gin 
1685 1690 1695 

Asn Val Ala Asp Lys Arg Leu Ala Ala Ser He Ala He Cys Thr Asp 
1700 1705 1710 

He Ser Arg Ser Thr Glu Cys Arg Thr He Arg Lys Gin His Leu He 
1 ? 15 1720 1725 
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Asp Ser Arg Sar Leu His Ser Ser Trp Glu Ala Gly Leu lie Gly Lys 
1730 1735 1740 

Asp Asp Glu Trp Tyr Lys Lau Phe Ser Lys Ser Tyr Thr Gin Ala Asp 
1745 1750 1755 1760 

Leu Ala Lau Gin Ser Tyr His Leu Asn Thr Ala Ala Lys Ser Trp Leu 
1765 1770 1775 

Gin Ser Gly Asn Thr Lys Pro Leu Ser Glu Trp Met Ser Asp Gin Gly 
1780 1785 1790 

Tyr Thr Leu lie Ser Gly Val Asn Pro Arg Phe lie Pro He Pro Arg 
1795 1800 1805 

Gly Phe Val Lys Gin Asn Thr Pro He Thr Asn Val Lys Tyr Pro Glu 
1810 1815 1820 

Gly He Ser Phe Asp Thr Asn Leu Lys Arg His Leu Ala Asn Ala Asp 
1825 1830 1835 1840 

Gly Phe Ser Gin Glu Gin Gly He Lys Gly Ala His Asn Arg Thr Asn 
1845 1850 1855 

Phe Met Ala Glu Leu Asn Ser Arg Gly Gly Arg Val Lys Ser Glu Thr 
1860 1865 1870 

Gin Thr Asp He Glu Gly He Thr Arg He Lys Tyr Glu He Pro Thr 
1875 1880 1885 

Leu Asp Arg Thr Gly Lys Pro Asp Gly Gly Phe Lys Glu He Ser Ser 
1890 1895 1900 

He Lys Thr Val Tyr Asn Pro Lys Lys Phe Ser Asp Asp Lys He Leu 
1905 1910 1915 1920 

Gin Met Ala Gin Asn Ala Ala Ser Gin Gly Tyr Ser Lys Ala Ser Lys 
1925 1930 1935 

He Ala Gin Asn Glu Arg Thr Lys Ser He Ser Glu Arg Lys Asn Val 
1940 1945 1950 

He Gin Phe Ser Glu Thr Phe Asp Gly He Lys Phe Arg Ser Tyr Phe 
1955 1960 1965 
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Asp Val Asn Thr Gly Arg lie Thr Asn lie His Pro Glu 
19™ 1975 1980 

(2) INFORMATIONS POUR LA SEQ ID NO: 39: 

(l) CARACTERISTICUES DE LA SEQUENCE : 
(A) LONGUEUR: 143 acicies amines 
(3) TYPE: acide amine 

(C) NOME- RE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(11) TYPE DE MOLECULE: peptide 

( i:< ) CARACTERISTIQUE : 

(A) NOM/CLE: Peptide 
( 3 ) EMPLACEMENT : 1 . .14 3 

(xi) DESCRIPTION DE LA SEQUENCE : SEC ID NO: 39: 

Met Lys Asn Asn lie Phe Leu Asn Leu Asn Lys Lys Ser He Asn Asn 
15 10 15 

Asn His Phe Val lie Ser lie Phe Phe Glu Thr He Tyr Gin Phe Glu 
20 25 30 

Thr Lys Asp Thr Leu Leu Glu Cys Phe Lys Asn He Thr Thr Thr Gly 
35 40 45 

His Phe Gly Val lie Gly Ala Gin Tyr Glu Lys He Asp Ala Thr Arg 
50 55 60 

Trp He Gly Asp Tyr Glu Glu Val Asn Gly Phe Glu Tyr He Asp Lys 
65 70 75 80 

Ala Pro Ser He Tyr Phe Ser Val Gly Asp Asp Phe Asn Pro Glu Glu 
85 90 95 

Leu He He Pro He Asn Leu Ala Tyr His Tyr Phe Asn He Ala He 
100 105 no 

Ser Asp Phe Leu He Ala His Pro Glu Tyr Gin Lys Lys Cys Lys Glu 
H5 120 125 
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He Gin Lys Thr Tyr Ser Gin Thr Asn Cys Ser Leu His Glu Thr 
130 135 140 

) INFORMATIONS POUR LA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 833 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(li) TYPE DE MOLECULE: peptide 

(ix) CARACTERISTIQUE; 

(A) NOM/CLE: Peptide 
(3) EMPLACEMENT : 1 . 833 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 40: 

Val Leu Lys Thr Pro Pro Thr Leu Ala Ala Glu Leu Ser Gly Lys Thr 
15 10 15 

Gly Val Ser He Ser Ala Pro Tyr Ala Asn Glu Asn Ser Arg lie Leu 
20 25 30 

Leu Ser Thr Thr Asp He Ser Ser Glu Asn Gly Lys He Lys He Gin 
35 40 45 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 60 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 75 80 

He Thr Glu Val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 95 

Leu Ser Ala Ser Gin Gly He Asp He Lys Ser Gly Gly Ser He Asp 
100 105 110 

Ala Tyr Ala Thr Ala Phe Asp Ala Pro Lys Gly Ser He Asn He Glu 
115 120 125 
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Ala Gly Arg Lys Leu Thr Leu Tyr Ala Val Glu Glu Leu Asn Tyr Asp 
130 135 140 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Gly He Ser Tyr Ser 
1-55 150 155 160 

Lys Aia His Asp Thr Thr Thr Gin Val Met Lys Thr Ala Leu Pro Ser 
165 170 175 

Arg Val Val Ala Glu Ser Ala Asn Leu Gin Ser Gly Trp Asp Thr Lys 
180 185 190 

Leu Gin Gly Thr Gin Phe Glu Thr Thr Leu Gly Gly Ala Thr lie Arg 
195 200 205 

Ala Gly Val Gly Glu Gin Ala Arg Aia Asp Ala Lys He lie Leu Glu 
210 215 220 

Gly lie Lys Ser Ser He His Thr Glu Thr Val Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn lis Glu Thr Leu 
245 250 255 

Gin Leu Pro Ser Phe Thr Gly Pro Val Ala Pro Val Leu Ser Ala Pro 
260 265 270 

Gly Gly Tyr He Val Asp He Pro Lys Gly Asn Leu Lys Thr Gin He 
275 280 285 

Glu Thr Leu Thr Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Ala Lys Asn He Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Ala Ala Ala Val Val 
325 330 335 

Val He Val Val Thr Val Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Ala Ala Gly Thr Ala Gly Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 
355 360 365 
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Ala Gly Thr Ala Ala Gly Thr Gly Val Ala Ala Gly Thr Ala Ala Thr 
370 375 380 

Thr Gly Val Ala Ala Gly Thr Ser Ala Ala Ala He Thr Thr Ala Ala 
385 390 395 400 

Gly Lys Ala Ala Leu Ala Ser Leu Ala Ser Gin Ala Ala Val Ser Leu 
405 410 415 

lie Asn Asn Lys Gly Asp He Asn His Thr Leu Lys Glu Leu Gly Lys 
420 425 430 

Ser Ser Thr Val Arc Gin Ala Ala Thr Ala Ala Val Thr Ala Gly Val 
435 440 445 

Leu Gin Gly He Ser Gly Leu Asn Thr Gin Ala Ala Glu Ala Val Ser 
450 455 460 

Lys His ?he His Ser Pro Ala Ala Gly Lys Leu Thr Ala Asn Leu He 
465 470 475 480 

Asn Ser Thr Ala Ala Ala Ser Val His Thr Ala lie Asn Gly Gly Ser 
485 490 495 

Leu Lys Asp Asn Leu Gly Asp Ala Ala Leu Gly Ala He Val Ser Thr 
500 505 510 

Val His Gly Glu Val Ala Ser Lys He Lys Phe Asn Leu Ser Glu Asp 
515 520 525 

Tyr lie Ala His Lys He Ala His Ala Val Ala Gly Cys Ala Ser Ala 
530 535 540 

Val Ala Asn Lys Gly Lys Cys Arg Asp Gly Ala He Gly Ala Ala Val 
545 550 555 560 

Gly Glu Met Val Gly Glu Thr Leu Leu Asp Gly Arg Asp Val Gly Lys 
565 570 575 

Leu Ser Pro Gin Glu Arg Gin Lys Val He Ala Tyr Ser Gin He He 
580 585 590 

Ala Gly Ser Ala Val Ala Leu Val Lys Gly Asp Val Asn Thr Ala Val 
595 600 605 
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Asn Ala Ala Thr Val Ala Val Glu Asn Asn Ser Leu Leu Ala Arg Arg 
610 615 620 

Arg Val Asn He Arg Tr? Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
625 630 635 5 4 0 

Ala He Leu Glu He Gin Ala lie Thr Asn Gin He Arg Arg Leu Asp 
645 650 655 

Pro Lys Phe Asn Gly He Ala He Leu Arg Thr Pro Gly Glu Pro Trp 
660 665 670 

Thr Arg His Asp Val Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
675 680 685 

Glu Ser Arg Gly Phe Ala Val Glu Pro lie Tyr Arg lie Arg He Asn 
690 695 700 

Asn Gly Asn Glu Phe Asn Arg He Met Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Val Ala Asn Pro Lys Ser Ala Thr Gly Tyr Phe Arg Val 
725 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu He He Ser Arg Lys Phe Thr 
740 745 750 

Gin Phe Ser Gin He Gin Glu Ser Thr Gly He Gly Tyr lie Lys Glu 
755 760 765 

Ala Val Arg Lys Tyr Ser Pro Gly Thr Val lie Ser Asn Val Pro Ser 
770 775 780 

Thr Pro Thr Thr He Arg Gly Arg Lys Leu Glu Gly Lys Leu He Leu 
785 790 795 800 

Glu Val Pro Ala Gin Val Asn Pro He Pro Gin Ser Val Leu Arg Ala 
805 810 815 

Ala Gin Glu Glu Asn Val He He Arg Asp Thr Thr Gly Arg He Tyr 
820 825 830 
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(2) INFORMATIONS POUR LA SEQ ID NO: 41: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 8 33 acides amines 
(3) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41: 

Val Leu Lys Thr Pro Pro Thr Leu Aia Ala Glu Leu Ser Gly Lys Thr 
15 10 15 

Gly Val Ser lie Ser Ala Pro Tyr Ala Asn Glu Asn Ser Arg lie Leu 

20 25 30 

Leu Ser Thr Thr Asp He Ser Ser Glu Asn Gly Lys He Lys He Gin 
35 40 45 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 60 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 75 80 

He Thr Glu Val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 95 

Leu Ser Ala Ser Gin Gly He Asp He Lys Ser Gly Gly Ser He Asp 
100 105 110 

Ala Tyr Ala Thr Ala Phe Asp Ala Pro Lys Gly Ser He Asn He Glu 
115 120 125 

Ala Gly Arg Lys Leu Thr Leu Tyr Ala Val Glu Glu Leu Asn Tyr Asp 
130 135 140 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Gly He Ser Tyr Ser 
145 150 155 160 

Lys Ala His Asp Thr Thr Thr Gin Val Met Lys Thr Ala Leu Pro Ser 
165 170 175 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 



PCT/FR97/01295 



Arg Val Val Ala Glu Ser Ala Asn Lsu Gin Ser Gly Trp Asp Thr Lys 
130 185 190 

Leu Gin Gly Thr Gin Phe Glu Thr Thr Leu Gly Gly Ala Thr lie Arg 
195 200 205 

Ala Gly Val Gly Glu Gin Ala Arg Ala Asp Ala Lys lie lie Leu Glu 
210 215 220 

Gly He Lys Ser Ser lie His Thr Glu Thr Val Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn lie Glu Thr Leu 
215 250 255 

Gin Leu Pro Ser Phe Thr Gly Pro Val Ala Pro Val Leu Ser Ala Pro 
260 265 270 

Gly Gly Tyr lie Val Asp He Pro Lys Gly Asn Leu Lys Thr Gin lie 
275 280 285 

Glu Thr Leu Thr Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Ala Lys Asn lie Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Ala Ala Ala Val Val 
325 330 335 

Val He Val Val Thr Val Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Ala Ala Gly Thr Ala Gly Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 
355 360 365 

Ala Gly Thr Ala Ala Gly Thr Gly Val Ala Ala Gly Thr Ala Ala Thr 
370 375 380 

Thr Gly Val Ala Ala Gly Thr Ser Ala Ala Ala He Thr Thr Ala Ala 
385 390 395 400 



Gly Lys Ala Ala Leu Ala Ser Leu Ala Ser Gin Ala Ala Val Ser Leu 
405 410 415 
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He Asn Asn Lys Gly Asp He Asn His Thr Leu Lys Glu Leu Gly Lys 
420 425 430 

Ser Ser Thr Val Arg Gin Ala Ala Thr Ala Ala Val Thr Ala Gly Val 
435 440 445 

Leu Gin Gly He Ser Gly Leu Asn Thr Gin Ala Ala Glu Ala Val Ser 
450 455 460 

Lys His Phe His Ser Pro Ala Ala Gly Lys Leu Thr Ala Asn Leu lie 
465 470 475 480 

Asn Ser Thr Ala Ala Ala Ser Val His Thr Ala lie Asn Gly Gly Ser 
485 490 495 

Leu Lys Asp Asn Leu Gly Asp Ala Ala Leu Gly Ala lie Val Ser Thr 
500 505 510 

Val His Gly Glu Val Ala Ser Lys He Lys Phe Asn Leu Ser Glu Asp 
515 520 525 

Tyr He Ala His Lys lie Ala His Ala Val Ala Gly Cys Ala Ser Ala 
530 535 540 

Val Ala Asn Lys Gly Lys Cys Arg Asp Gly Ala He Gly Ala Ala Val 
545 550 555 560 

Gly Glu Met Val Gly Glu Thr Leu Leu Asp Gly Arg Asp Val Gly Lys 
565 570 575 

Leu Ser Pro Gin Glu Arg Gin Lys Val He Ala Tyr Ser Gin lie He 
580 585 590 

Ala Gly Ser Ala Val Ala Leu Val Lys Gly Asp Val Asn Thr Ala Val 
595 600 605 

Asn Ala Ala Thr Val Ala Val Glu Asn Asn Ser Leu Leu Ala Arg Arg 
610 615 620 

Arg Val Asn He Arg Trp Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
625 630 635 640 

Ala He Leu Glu He Gin Ala lie Thr Asn Gin lie Arg Arg Leu Asp 
645 650 655 
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Pro Lys Phe Asn Gly He Ala lie Leu Arg Thr Pro Gly Glu Pro Trp 



Thr Arg His Asp Val Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
675 680 685 

Glu Ser Arg Gly Phe Ala Val Glu Pro He Tyr Arg lie Arg He Asn 
690 695 700 

Asn Gly Asn Glu Phe Asn Arg He Met Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Val Ala Asn Pro Lys Ser Ala Thr Gly Tyr Phe Arg Val 
725 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu He He Ser Arg Lys Phe Thr 
740 745 750 

Gin Phe Ser Gin He Gin Glu Ser Thr Gly He Gly Tyr He Lys Glu 
755 760 765 

Ala Val Arg Lys Tyr Ser Pro Gly Thr Val He Ser Asn Val Pro Ser 
770 775 780 

Thr Pro Thr Thr He Arg Gly Arg Lys Leu Glu Gly Lys Leu He Leu 
785 790 795 800 

Glu Val Pro Ala Gin Val Asn Pro He Pro Gin Ser Val Leu Arg Ala 



Ala Gin Glu Glu Asn Val He He Arg Asp Thr Thr Gly Arg He Tyr 
820 825 830 



Lys 



(2) INFORMATIONS POUR LA SEQ ID NO; 42: 

(X) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 162 acides amines 

(B) TYPE: acide amin6 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
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(11) TYPE DE MOLECULE: peptide 



PCT/FR97/01295 



(l.x) CARACTZRISTIQUE: 

(A) NCM/CLE: Peptide 

(B) EMPLACEMENT: 1 . . 152 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42: 

Met Lys Lys Asp He Phe Tyr Cys Glu Gin Trp Ser Tyr Giy Tyr Lys 
1 5 10 15 

Arg Leu His Lys Pro Phe Ser Glu Lys Gin Ala Glu Glu Lys His Leu 
20 25 30 

Lys Gly Glu Leu Tyr Thr Ala Val lie Gly Ser Ala Thr Gin Pro Glu 
35 40 45 

Tyr Val lie Thr Leu Arg Glu Glu Val Gly Phe Phe Ser Val Asn Phe 
50 55 60 

Phe Asp Lys Phe Gly Arg Asp Tyr Leu Thr His Gin Phe Gin Lys Tyr 
65 70 75 80 

Ser Asn Ser Asn Tyr Tyr Phe Leu Ser Met Ala Val Trp Arg Asp Tyr 
85 90 95 

He Thr Leu Glu Ser His Asp Leu Ala Glu Gly Tyr Thr Tyr Phe Phe 
100 105 110 

Asn Glu Asn Thr Asp Asp Cys Tyr Val Leu Lys Gin Asp Phe He Asn 
115 120 125 

Asn Glu Arg Tyr Glu Lys Thr Glu Leu Tyr Ser Gin Lys Asp Lys Val 
130 135 140 

He Leu Phe Pro Lys Phe Gly Glu Tyr Asp Leu Val Leu Asn Pro Asp 
145 150 155 160 

He He 



INFORMATIONS POUR LA SEQ ID NO : 4 3 
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(i) CARACTERISTIQUES CE LA SEQUENCE: 

(A) LONGUEUR: 90 acides amines 

(B) TYPE: acide amine 

(C) NOMERE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE : peptide 



( ix ) CARACTERISTIQUE : 

(A) NOM/CLE. Peptide 

(B) EMPLACEMENT: 1 . . 90 



(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 43: 

Met Asn Lys Arg Met Lys Met Cys Pro Ala Cys Gin Gin Gly Tyr Leu 
15 10 15 

Tyr His Ser Lys Pro Lys Tyr Leu His Asp Glu lie lie Leu Cys Asp 
20 25 30 

Glu Cys Asp Ala Val Trp Leu Lys Gly Met Asn He Phe Tyr Gly Glu 
35 40 45 

Tyr Glu Lys Asp Phe Tyr Ser Tyr Val Pro Phe Met Glu Ser Gin Gly 
50 55 60 

He Thr Ser Glu Cys He Trp Glu Gly Asp Leu Phe Asp His Pro Tyr 
65 70 75 80 

Tyr Glu Asp Glu Asn Ser Asn Asp Met Asp 
85 90 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 313 acides amines 

(B) TYPE: acide amin6 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE : peptide 
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(ix) CARACTERISTIC.UE : 

(A) NOM/CLZ: Peptide 

(B) EMPLACEMENT: 1 . . 313 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4 4 : 

Met Ser Ala Thr Glu lie Glu Lys Ala Lys Ala Lys lie Thr Ala Tyr 
15 10 15 

Ser Lys Leu Val Ala Gly Thr Ala Ser Ala Val Val Gly Gly Asp Vai 
20 25 30 

Asn Thr Ala Ala Asn Ala Ala Gin He Ala Val Glu Asn Asn Thr Leu 
35 40 45 

Tyr Pro Arg Cys Val Gly Ala Lys Cys Asp Glu Phe Gin Lys Glu Gin 
50 55 60 

Gin Lys Trp He Arg Glu Asn Pro Glu Glu Tyr Arg Glu Val Leu Leu 
65 70 75 80 

Phe Gin Thr Gly Phe He Pro He He Gly Asp He Gin Ser Phe Val 
85 90 95 

Gin Ala Gin Thr Ala Ala Asp His Leu Phe Ala Leu Leu Gly Val Val 
100 105 110 

Pro Gly He Gly Glu Ser He Gin Ala Tyr Lys Val Ala Lys Ala Ala 
115 120 125 

Lys Asn Leu Gin Gly Met Lys Lys Ala Leu Asp Lys Ala Ala Thr Val 
130 135 140 

Ala Thr Ala Gin Gly Tyr Val Ser Lys Thr Lys He Lys He Gly Gin 
145 150 155 160 

Thr Glu Leu Arg Val Thr Ala Ala Thr Asp Lys Gin Leu Leu Lys Ala 
165 170 175 

He Gly Glu Gly Arg Asp Thr Thr Gly Lys Met Thr Glu Gin Leu Phe 
180 185 190 

Asp Ser Leu Ala Lys Gin Asn Gly Phe Arg Val Leu Ser Gly Gly Lys 
195 200 205 
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Tyr Gly Gly Asn Asn Gly Phe Asp His Val Trp Gin Ala Ala Asp Gly 
210 215 220 

Ser Val Val Leu lie Val Glu Sar Lys Gin He Arg Asn Gly Thr Val 
225 230 235 240 

Gin Leu Asn Pro Asn Gly Ala Gly Gly Tyr Thr Gin Met Ser Glu Asp 
245 250 255 

Trp He Arg Gin Val Leu Asp Gin Leu Pro Asp Gly Ser Pro Ala Lys 
260 265 270 

Ala Ala Val Phe Lys Ala Asn Lys Asn Gly Thr Leu Lys Thr Ala He 
275 280 285 

Ala Gly Val Asp Arg Gin Thr Gly Lys Ala Val lie Leu Pro Val Lys 
290 295 300 

Val Pro Ser Lys Thr Asn He Arg Arg 
305 310 

(2) INFORMATIONS POUR LA SEQ ID NO: 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 311 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : sxmple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: peptide 



(ix) CARACTERISTIQUE ; 

(A) NOM/CLE: Peptide 

(B) EMPLACEMENT : 1 . . 311 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45: 

Met Gly His Asn Met Met Thr Thr Gin Lys Trp Tyr Glu His He Thr 
15 10 15 

Asn Val He He Gly Asn Thr Ala Asn Phe Asn Ser Gly Cys Leu Asp 

20 25 30 
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Ser lie Asp Tyr Val Asp Glu Arg Lys Gly Val Pro Lsu Ala Ala Met 



Gin His He Phe Met Asp Val Arg Ala Ala Ala Ser His Ala Tyr Leu 



Phe Glu His Asp Leu Lys Lys Phe Lys Gin Tyr Ala Tyr Val Ala Gly 



Lys Leu Gly Val Leu Leu Ser Val Asn Ser Thr Asp Pro Glu Pro Phe 



Phe Phe Pro Cys Asp Met Leu Asn He Gin Asn Pro Met Phe Leu Met 
100 105 110 



Leu Met Ser Asp Ser Pro Gin Leu Arg Glu Phe Leu Val Arg Asn He 
115 120 125 



Asp Asn He Ala Asn Asp Thr Glu Ala Phe lie Asn Arg Tyr Asp Leu 
130 135 140 



Asn Arg His Met He Tyr Asn Thr Leu Leu Met Val Glu Gly Lys Gin 
145 150 155 160 



Leu Asp Arg Leu Lys Gin Arg Ser Glu Lys Val Leu Ala His Pro Thr 
165 170 175 



Pro Ser Lys Trp Leu Gin Lys Arg Leu Tyr Asp Tyr Arg Phe Phe Leu 
180 185 190 



Ala Phe Ala Glu Gin Asp Ala Glu Ala Mei Lys Ala Ala Leu Glu Pre 
195 200 205 



Leu Phe Asp Lys Lys Thr Ala Arg Met Ala Ala Lys Glu Thr Leu Ser 
210 215 220 



Tyr Phe Asp Phe Tyr Leu Gin Pro Gin He Val Thr Tyr Ala Lys He 
225 230 235 240 



Ala Ser Met His Gly Phe Asp Leu Gly He Asp Gin Glu He Ser Pro 
245 250 255 



Arg Asp Leu He Val Tyr Asp Pro Leu Pro Ala Asp Glu Tyr Gin Asp 
260 265 270 
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lie Phe Asp Phe Met Lys Gin Tyr Asp Leu Ser Tyr Pro Tyr Glu Tyr 
275 280 285 

Leu Gin Asp Trp He Asp Tyr Tyr Thr Phe Lys Thr Asp Lys Leu Vai 
290 295 300 

Phe Gly Asn Ala Lys Arg Glu 
305 310 



(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46: 
GCCACCGGTA CGGAAACTGA A 

(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE; ADN (genomique) 
(iii) HYFOTHETIQUE : NON 
(iv) ANTI-SENS ; NON 
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(xi) DESCRIPTION DE LA SEQUENCE: SEg ID NO: 47: 
CCTGAATTCA TGTCTATTCC ATTTTGAAGA 3 0 

(2) INFORMATIONS POUR LA SEQ ID NO: 48: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i l ) HYPOTHETI QUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48: 
CCGAGATCTT TAACCCTTTG GGCTTAAGCG A 31 
(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 2 9 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: Simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49: 
GGGAGATCTC CCGCTCGTGT TGTGCATTA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(1) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50 
AAGAGATCTG CAGCCAAGGC TCTCGAAA 
(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 51: 
GGGAGATCTC AGGCTGCCGC CGTTGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 52: 
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(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 8 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52: 
GGGAGATCTC ACCCCAAGAA CGCCAAAA 2 8 

(2) INFORMATIONS POUR LA SEQ ID NO: 53: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 
GGGAGATCTG AACGTATAGT AATCTATCCA A 31 
(2) INFORMATIONS POUR LA SEQ ID NO: 5 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(11) TYPE DE MOLECULE; ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(lv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54 
AGTGGCTCCT AG 

(2) INFORMATIONS POUR LA SEQ ID NO: 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHET I QUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 55: 
AGCACTCTCC AGCCTCTCAC CGAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 
AGTGGCTCTT AA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 10 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
• ( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 
AGTGGCTGGC 10 
(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
( l i l ) HYFOTHET I QUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58: 
AGCACTCTCC AGCCTCTCAC CGAC 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIOUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID MO: 59: 
GTACTTGCCT AG 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(lii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 
ACCGACGTCG ACTATCCATG AACG 
(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 61: 
GTACTTGCTT AA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 62: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 10 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(li) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 62: 
GTACTTGGGC 10 
(2) INFORMATIONS POUR LA SEQ ID NO: 63: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(in) HYPOTHETIQUE: NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 63: 
ACCGACGTCG ACTATCCATG AACC 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 6 4 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN (genomique) 
(lii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS; NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 64: 
AATTCTCCCT CG 

(2) INFORMATIONS POUR LA SEQ ID NO: 65 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 pa ires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 65: 
AGGCAACTGT GCTATCCGAG GGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 66: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 140 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS . simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 66: 
GATCAACTTT TCCCTGTTTG TCCCATTACC GGTTTGAATG AACCGATTGC GCGCCGCGCG 
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TGTTGTTGGA CATTACCTGC GATTCAGACG GTACGATTGA CCACTACATC GAGGAGAACG 



GCAATCAGGG TACAATGCTA 

(2) INFORMATIONS POUR LA SEQ ID NO: 67: 
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(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 192 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( l i l ) HYPOTHETIQUE : MON 
(iv) ANTI-SENS: MON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 67: 
GATCCGCGTA CTTGGTTTTT CATATTTTGC ATAGTCTTGT CGGTCGGGCA TCTTCCCCGA 
CATCATCTAA ATTTGTCTTT ATTGGTTTTT ACGCCACTCA TTGCGGATAA ACAATATTCC 
GCCTTGCCGT CGCGAATGTT CAAGCTAGCC TGCATCACCG TAATCAGGTT GCCCGTTACC 
GAGCCTTCGA GA 

(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(l) CARACTERISTigUES DE LA SEQUENCE: 

(A) LONGUEUR : 183 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYFOTHETigUE : NON 
(iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 68: 
GATCCGGCTG CCCGACGCGC GCAAAATTGC CGCCGAGGAA AGCGCGCACA ACCACGACGG 
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CAAAACCAGC GTATGGCAAT ACAAACATCT CGTGTTCGGT ACGGCAGGCA TTTTCTGCTA 120 
TGTCGGCGC3 GAGGTGTCTA TCGGTTCGTT GATGGTCAAC GTATTGGGTT ATCTGAAAGG ISO 
GCTGGATC 

133 

(2) INFORMATIONS POUR LA SEQ ID NO: 69 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 304 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

in) TYPE DE MOLECULE : ADN (genomique) 
( i i l I HYP OTHET I QUE : NCN 
(IV) ANT I -SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 69: 
GATCCCCCAC TTTACCTCGG GCAGATTTTG CGCGTTCATT ACAATAGCGT ATTTATGCGT 6 0 

TTGCGTTTGC GCTTGCCGCT GCCCCCCCCC CGCCGGTATG GGAAAACATC AATATGGCGG 120 
TATAAAGCGC GGTATGGCGG AAAACCTGCC GTTTCCAAGT TTTATTCATC TTTTATTCCT 180 
TGAGTTTGCC TTCACGGGAC GGGGCGGCGC GCGGAACGCG GGGTTCGGTA AACCGCCCGA 240 
TTCCGCGCCC GCCGAATTGC TGATTGAAAA GCTTACTTCC CCATTTTAAC TTTGCACACT 300 
GATC 

304 

(2) INFORMATIONS POUR LA SEQ ID NO : 70: 

(i) CARACTERISTIQUES DE LA SEQUENCE. 

(A) LONGUEUR: 24 3 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
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(iil) HYPOTHETICUE : NON 
(iv) ANTI-SENS. NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 70: 
GATCAGACCC ATTTTCAGCG CACCGTAAGC GCGGATTTTC TCGAATTTTT CCAAAGCTGC 5 0 

GGCATCGTTG TTGATGTCGT CTTGCAACTC TTTGCCCGTG TAGCCCAAGT CGGCGGCATT 120 
CAGGAAAACG GTCGGAATGC CCGCGTTGAT GAGCGTGGCT TTCAAACGGC CTATATTOGG 180 
CACATCAATT TCATCGACCA AATTGCCGGT TGGGAACATA CTGCCTTCGC CGTCGGCTGG 2 4 0 

ATC 2 43 
(2) INFORMATIONS POUR LA SEQ ID NO: 71 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR. 236 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(ill) HYPOTHETIQUE : NON 

(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 71. 

CGGCGGCGTAGTccgccGcgACAGCGTTACCATAAGCGGGACAGACTACACCCCTTTATCT 
AAC C C G C AAAGTTTGG AT AC GG AATT AAAATGGTTGCTTC AAGAAGCTC C C GAAAT AG 
AAAATCCTTTCGACCGCGCCGTTTATCTCCATAATAATTTGGCGTATCTTCAATATTTT 
AAAGATTGCAATAAACGTACTGCCAGAAACTGCATGACCTTGTCGCTGATGCGCTCCG 

(2) INFORMATIONS POUR' LA SEQ ID NO: 72: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 280 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(11) TYPE DE MOLECULE ; ADN (genomique) 
( 1 1 i ) HYPOTHET I QUE : MON 
(iv) ANTI-SENS: N'ON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 72: 
CGGTCAATCA CAAGAAAGTC AGCCGTCTGA TGGCGAAGAC GGGGCTGAAG GCAGTGATAT 
GGCGGCGCAA ATACCGCTCG TTCAAAGGAG AAGTCGGCAA AATTGCGCCG AATATCCTGC 
GACGCTGTTT CCATGCAGAA AAGCCGAATG AGAAATGGGT AACGGACGTT GCCGAGTTCA 
ATGTAGGCGG AGAAAAGATA TACCTTTCTC CGATTATGGA TTTGTTTAAC GGGGAAATC3 
TCAGTTACCG TATTCAGACC CGCCCGACTT TCGATTTGGC 
(2) INFORMATIONS POUR LA SEQ ID NO: 73: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 120 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i l ) HYPOTHET I QUE : NON 
(iv) ANTI-SENS: NCN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 73: 
CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC GGACTGTGCT GCGAACGAAA 
ACTCCTTACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG CTCAAGGAGA GAGCTATCAT 
(2) INFORMATIONS POUR LA SEQ ID NO: 74: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 120 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN (genomique) 
( 1 l i ) HYFOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 74' 

CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC GGACTGTGCT GCGAACGAAA 6 0 

ACTCCTTACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG CTCAAGGAGA GAGCTATCAT 120 

(2) INFORMATIONS POUR LA SEQ ID NO: 75: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 152 paires de bases 
13) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
(ili) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 75: 

CGGTGl rTTT CTTAACAATT CGCCGACTTC ATGGCGATAT TTAAGTGACA GTTGCTCCGC 6 0 

CCACGCAGTT GCGCCGAACT CAGCACCACG ACATTATACT GATTATGCAC ATCGGCAAGA 120 

TCAAACTGAC CTATCGTAGT ATCGCAGACT GT 152 

(2) INFORMATIONS POUR LA SEQ ID NO: 7 6 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 381 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(IV) ANTI-SENS : NON 



(Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 76: 

CGGGAGOTTTTGTGCATCCTGATACCGATCGGTTGTTGTTGCTCAAAGGACAGAAGGC 
CGCTGATAA.ACGAGATTACCTGTTTGTCGCTATTGACGATTTTTATACTCTGCCATTTT 
GCCAGACAAAACCGCAGACAGTGCTGCCAAGTTTCTGACCGAACATCTGGCCGACCCC 
TGCTTGTACCTGATTGAGTACGCTTACTCTGACAATGATAGGTAATATAAAGAGCCGTC 
CAACATGCTTTCGGTGCAGTTTGTTATGATAATGGGATTGGTTGGAGGCTTGCCCGATT 
TGCTTGTCCGCAGACCAACGGTAAGGCGGAGCGGGTTATCCGTACCTTGATGGAGATG 
TGGCATGAGGAACAGTCGTTTGACAGACCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 7 7 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 269 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYP OTHET I QUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 77: 
CGGAGCATAA AATCGTTATT AAAGATAATG GTATAGGAAC GAGCTTCGAT GAAATCAATG 6 0 

ATTTTTATTT GAGAATCGGT CGGAACAGAA GGGAAGAAAA ACAAGCCTCC CCGTGCGGAA 120 
GAATTCCAAC GGGTAAAAAA GGCCTTGGTA AATTGGCATT ATTCGGGCTT GGCAACAAAA 180 
TTGAAATTTC TACTATCCAG GGAAACGAAA GGGTTACTTT TACTTTGGAT TATGCAGAGA 24 0 

TTCGAAGAAG CAAGGGTATT TATCAACCG 269 
(2) INFORMATIONS POUR LA SEQ ID NO: 78 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 20 3 pa ires de bases 

(B) TYPE : nucleotide 
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(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN ( genomique ) 

(ill) HYPOTHETIQUE : NON 

(IV) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 78: 

CCKjATGAAAACGGCATACGCgcCAAAGTATTTACGAACATCAaAGGCTTGAAGATACCG 
CACACCTACATAGAAACGGACGCGAAAAAGCTGCCGAAATCGACAGATGAGCAGCTTT 
CGGCGCATGATATGTACGAATGGATAAAGAAGCCCGAAAATATCGGGTCTATTGTCAT 
TGTAGATGAAGCTCAAGACGTATGGCCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 79: 

(i) CARACTERISTIGUES DE LA SEQUENCE: 

(A) LONGUEUR: 229 paires do bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(IV) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 9 
CGGTTTCAGG TTGTCGCGAA GGCTCGGTAA CGGGCAACCT GATTACGGGT GATGCAGGCA 6 0 

GCTTGAACAT TCGCGACGGC AAGGCGGAAT ATGTTTATCC GCAATGAGTG GCGTAAAAAC 120 
CAATAAAGAC AAATTTAGAT GATGTCGGGG AAGATGCCCG ACCGACAAGA CTATGCAAAA 180 
TATGAAAAAC CAAGTACGCG GATCAGGCAT GGATGCACGA TCCAATCCG 229 
(2) INFORMATIONS POUR LA SEQ ID NO: 80: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 207 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(li) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(IV) ANT I -SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 80: 
CGGGTCGCTT TATTTTGTGC AGGCATTATT TTTCATTTTT GGCTTGACAG TTTGGAAATA 
TTGTGTATCG GGGGGGGGTA TTTGCTG A CG TAAAAAACTA TAAACGCCGC GCAAAATATG 
GCTGACTATA TTATTGACTT TGATTTTGTC CTGCGCGGTG ATGGATAAAA TCGCCAGCGA 
TAAAGAATTT GCGAGAACCT GATGCCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 81 : 



(i 



CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 224 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIOUE: NON 
(iv) ANT I -SENS . NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 81: 
CGGCAACGAT TTGAGCTATC GCGGTTACGA CATTCTGGAT TTGGCACAAA AATGCGAGTT 
TGAAGAAGTC GCCCACCTGC TGATTCACGG CCATCTGCCC AACAAATTCG AGCTGGCCGC 
TTATAAAACC AAGCTCAAAT CCATGCGCGG CCTGCCTATC CGTGTGATTA AAGTTTTGGA 
AAGCCTGCCT GCACATACCC ATCCGATGGA CGTAATGCGT ACCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 82: 
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(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 212 pa ires de bases 
(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(lv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 82: 
CGGGAACAGC CATTGCCCAC GCCCACGCCC CCCAAGAAAG ACGGAAACTA CTGCCTAAAT 6 0 

TTTCGGCAAT CAAGTTGACG ATTAAAGGGT TGGGGGCAGT TGCAGTAATA AACATAGCCG 120 
ACGAAATGGG ATTGGAATGA TAGTTGACCA AAGCCAAATA TTTACCCATC TTGCCTTCTG 180 
TGCCTTTTGC GGGATTGGAG CCGTAACTGC CG 212 
(2) INFORMATIONS POUR LA SEQ ID NO: 8 3 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 3 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYP OTHET I QUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8 3 
CGGGAATTCT GAGCAGAATG AAAGAAAGCA GGCTTGATAA TTTCATAAAG TTATTGGAAG 60 
AAAAAGGATT TACCGTCCAT TTCGGTATTC ACAATACGGC TGATTACGGA ATTCCCCAAA 120 
GCCGTAAAAG ATTTACGTTA ATTGCAAACA GAATAACCAA AGAAAAGCTG GAACCAGTCA 180 
AGTATTCGGG CAAACGGCTT ACGGTAGCCG ATGTTTTGGG AATGGAAATG GCTTTCCCAA 24 0 
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CATTATTGCA GGACACCAAG ACGAAACGGA TTTTATGCAT AGCTGTGCGG GAATTATCTG 
ATATCACTTG AACGATTGGC TTGATACCTA AAAACGGAGG AACCGTTGGC TIT 
(2) INFORMATIONS POUR LA SEQ ID NO : 84: 

(l) CARACTERISTIGUES DE LA SEQUENCE: 

(A) LONGUEUR: 308 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( l i l ) HVPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 84: 
AATTCCGTAT CCAAACTTTG CGGGTTAGAT AAAGGGGTGT AGTCTGTCCC GCTTATGGTA 
ACGCTGTCGC GGCGGACTAC GCCCGGAGCC TTTTTCCAGT AAGTTTTCGG AAATCAGGCT 
GTGGGTGGTT TTTAAGAAAT CCAACCAGTC AAACGGCTCG GGGCTGTCCA AACCGGACAC 
AGGTGCCGGT AACTTTCCCT CAGGTTGATT AACATTACGG CATCCGAATA TAACTTCCCG 
CCTGCGGTTT GCCCGAGTTT AAGCAATGCC TGCGTATCGT ATTGATTATA AAGTGTTTCC 
TTCCAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 85: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 104 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
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(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 85: 
AATTCGTGTG CCGCGTCGAC AAACCGCTGA CGTAGCGGAT GTCTCATGCC ACGTTTCAAA 6 0 

GCAGGTTGAT GGCGGTTAGC AACCCTCTGA TTTCACTGGG ATAT 104 
(2) INFORMATIONS POUR LA SEQ ID NO: 86: 

(1) CARACTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 8 9 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: 1 meal re 

(li) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 86: 
AATTGCGTAG AGTGGGCTTC AGCCACGTTT TTTCTTTTTC GGTCGTTGAT TGGTGGGCTG 6 0 

AACCACTTGT TTCGGAAATC CGTATCATG 8 9 

(2) INFORMATIONS POUR LA SEQ ID NO: 87: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 273 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 87: 
AATTTCCACC TATGCCCTAC GCAGCGATTA TCCGTGGTTT ACCCAAAGGG TGATTATGGC 6 0 
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AAAAGCGCGG GGTTGAGCGA CCGCCTTTTG TTGCCGGCGT TCAAACGGGT TTTGATAGGA 

AATGCAGGCA CGAAGCCTCG GCTGATTGTG ATGCACCTGA TGGGTTCGCA CAGTGATTTT 

TGCACACGTT TGGATAAGGA TGCGCGGCGG TTTCAGTATC AAACTGAAAA AATATCCTGC 

TATGTTTCCA TCAATCGCGC AAACCGATAA ATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 88: 

( l ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 2 70 pa ires de bases 
(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE ADN (genomique) 
(111) HYPOTHET I QUE : MON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 88: 
AATTCTTCCG CACGGGGAGG CTTGTTTTTC TTCCCTTCTG TTCCGACCGA TTCTCAAATA 
AAAATCATTG ATTTCATCGA AGTTCATTCC TATACCATTA TCTTTAATAA CGATTTTATG 
CTCCGGTTTA TCGAATAACC TAACTTCCAC TTCCGTAGCA CATGCATCGT AGGCATTCGC 
TATCAACTCG GCAATCGCAG GAACAGTGTG CGAATACAAT CTTTACACCC AAATGTTCGA 
TTACGGTTGG CTCGAAACTC AATTTCAATT 
(2) INFORMATIONS POUR LA SEQ ID NO: 89: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 267 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(li) TYPE DE MOLECULE: ADN (genomique) 
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( l i i ) HYPOTHETI QUE : NON 
(lv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE ; SEQ ID NO: 89: 
AATTATGAAC ACACGCATCA TCGTTTCGGC TGCGTTCGTT GCGTTGGCAT TAGCAGGTTG 
CGGCTCAATC AATAATGTAA CCGTTTCCGA CCAGAAACTT CAGGAACGTG CCGCGTTTGC 
CTTGGGCGTC ACCAATGCCG TAAAAATCAG CAACCGCAGC AATGAAGGCA TACGCATCAA 
CTTTACCGCA ACTGTGGGTA AGCGCGTGAC CAATGCTATG TTACCAGTGT AATCAGCACA 
ATCGGCGTTA CCACTTCCGA TGCAATT 
(2) INFORMATIONS POUR LA SEQ ID NO: 90: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 234 pa ires de bases 

(B) TYPE: nucleotide 

(C) NQMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTHET I QUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 90: 
AATTTTTATT TGGTTCGTAG TCATTTTGTG CAACTGAACG ATATTCGTTT TCATCATTGC 
TAACGTCTAG TGCCCATTGT GGCCCGTAAT AAGAGATTTC GTCTC CTTTT ACATGTTTGA 
CGCTGACGGC ATACTGGGGA TCGATGACGG ATAATGTACG TCTGTTGACA TCTGCAACGC 
TAAATCAATC ATCGGTATTG GATAATGCGT TGCCGATGTT TTGACTTGTA TGTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 91: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 295 pa ires de bases 

(B) TYPE: nucleotide 



120 
180 
234 
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(C) NCMBRE EE BRINS : simple 

(D) CONFIGURATION : lineaire 

(li) TYPE DE MOLECULE: ADN (qenomique) 
( l i 1 ) HYPOTHET I QUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 91: 
AATTCGGCCG GCTGTGTCAA ATAATGCGTT ACTTTGGCCG GGTCTTGTTC TTTGTAAGTG 6 0 

GTGGTCTTTT TTTGCGCGTT ATCCCCATCT GTTTGAGTGC ATAGCAAATG GTGGCTGCCG 120 
TACAATCAAA TGTTTGGCGT TCATGCAGAT AGGCATCATG GTGTTGCCCA ATATATTGAG 180 
CCGGTTTTTG CCTATCCGAT TTGACGGCAT TTAGACCGGT AACTTGATGT TTTAAGCTGC 240 
CTGTTTGTTT AAAGGCGAAT CCACAAGTAA AGCGTGTTTC TTGACAGGTT AAACG 2 95 

(2) INFORMATIONS POUR LA SEQ ID NO: 92: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 259 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 92: 
AATTGTGTAT ATCAAGTAGG ATGGGCATTT ATGCCTGACC TACAAAACCA AAAACAACCT 6 0 

ACCACCCTTA ATCAACTCCA CAAACCCTCT TCAGACAACC TCGTTTTTTG AAAAACAATC 120 
TGTAAACAGA TAACTGCTGA AGAATACCGT TGCCGAGCCC CAAAACCCGT ACTGCAACTT 180 
TTATTGTGAA CTTCCCATTA TGAGAAAATC CCTTTTCGTC CTCTTTCTGT ATTCGTCCCT 2 40 
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ACTTACTGCC AGCGAAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 93: 

(l) CARACTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 379 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(ii! TYPE DE MOLECULE: ADN (genomique) 
(ili) HYPOTHETIQUE ; NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 93: 
AATTGCACCA C3CGATGATG GGTACGCCTC TGTTGCCATT GCGACCGCCG CCGCCGTGCC 
CGGTACGCTG C-TCAACCTTG CCGCGGCGGA ACGGGTAAAG AAGTGCGCTT CGGGCATCCT 
TCCGGTACAT TGCGCGTCGG TGCAGCGCCG AATGTCAGGA CGGACAATGG ACGGCCACCA 
AAGCGGTTAT GAGCCGCAGC GCACGCGTGA TGATGGAAGG TTGGGTCAGG GTGCCGGAAG 
ATTGTTTTTA AATTGGACGG CGAACCGGTC TATTCGTATT GGCGTTATAC CGCCGCAAAG 
GCAGACCTTG AAACTGGTGC GTGCCGTGCA GGGCATGTAC GGCTATGTGT GCGTGGCGGG 
CGGATTTGAT GTGCGGAAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 94: 

( i ) CARACTER I ST I QUE S DE LA SEQUENCE : 

(A) LONGUEUR: 308 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE: NON 
(iv) ANTI-SENS : NON 



240 
300 
360 
379 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9-1: 

AATTTGTTGG GCAGATGGCC GTGAATCAGC AGGTGGGCGA CTTCTTCAAA CTCGCATTT7 6 0 

TGTGCCAAAT CCAGAATGTC GTAACCGCGA TACGTCAAAT CGTTGCCGGT ACGCAACGGT 120 

ACACAAAGCG GTATTACCGG CCGCAACGCC AGAAAGCGCA ACGGATTTTT AGGTTTGAGG 130 

GTCGGGGTTT GAGTAGTTTC AGTCATGGTA TTTCTCCTTT GTGTTTTTAT GGGTTTCGGG 24 0 

TTTTCAGACG ACCGATGCGG ATTTGTTGAA AGGCAGTCTG AAAGCGGTAA ATCATTTTTG 3 00 

AAA CA ATT 3Q8 
(2) INFORMATIONS POUR LA SEQ ID NO: 95: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 286 paires de bases 

(B) TYPE, nucleotide 

(C) NOMBRE DE BRINS: Simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 95: 

AATTCGGAGG AGCAGTACCG CCAAGCGTTG CTCGCCTATT CCGGCGGTGA TAAAACAGAC 60 

GAGGGTATCC GCCTGATGCA ACAGAGCGAT TACGGCAACT TGTCCTACCA CATCCGTAAT 120 

AAAAACATGC TTTTCATTTT TTCGGCAAGC AATGACGCAC AAGCTCAGCC CAACACAACT 180 

GACCCTATTG CCATTTTATG AAAAAGACGC TCAAAAAGGC ATTATCACAG TTGCAGGCGT 240 

AGACCGCAGT GGAGAAAAGT TCAATGGCTC CAACCATTGC GGAATT 286 

(2) INFORMATIONS POUR LA SEQ ID NO: 96: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 238 paires de bases 
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( 3 ) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( l i i ) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 96: 
AATTTGGATA CGTTGGAAAA GGGATATTTG ATTGGGAATG GGATGAAGAT AAGCGTAGAT 6 0 

GAGTTGGGGA AAAAAGTGTT AGAACATATC GGTAAGAATG AACCGTTATT GTTGAAAAAT 120 
CTACTGGTTA ACTTCAATCA GGGAAAACAT GAAGAAGTTA GGAAGTTGAT TTATCAGTTG 180 
ATAGAGTTAG ATTTTCTGGA ACTTTTGTGA GGGATTCTAT GAAAAACTGG AAGCAATT 2 38 

(2) INFORMATIONS POUR LA SEQ ID NO: 97: 

( l ) CARACTERISTigUES DE LA SEQUENCE : 

(A) LONGUEUR; 3 22 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS; simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 97: 
AATTCGGCAC GCAGGTTTTC TAAAAAAAGG CCGTTGATGA CTTTGTCGAT ATTGGCGGCT 60 
TCGGTGTAGT GCGCGCCCGC TTCGGCCGCT CTTGCGCGTC CATGACGGAT TGGAAGAGCG 120 
TGCCGAAGAT TTCTGGACTG ATGTTGCGCC AGTCGAAATT GCCGACACGG GAGGAATACC 180 
TGCCAACAAG AGTGCAGGCA GCGTAATCAA ACCACCCCCA CCCGCAATCG CATCGATAAA 240 
TCCGGCAATC ATCGCAACCA AACCCAAAGC GAGTATTATG TATAAATCTT CCATGTTTCT 300 
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TAATCCTGTT AACTTGCACC AA 3 22 

(2) INFORMATIONS POUR LA SEQ ID NO: 98: 

(i) CARACTERISTigUES DE LA SEQUENCE: 

(A) LONGUEUR : 316 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(Xl! DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9 8 
AATTTGTCGG CAATCTTCCC GGGTCGCTTT ATTTTGTGCA GGCATTATTT TTCATTTTTG 6 0 

GCTTGACAGT TTGGAGATAT TGTGTATCGG GGGGGGGTAT TTGCTGACGT AAAAAACTAT 120 
AAACGCCGCA GCAAAATATG GCTGACTATA TTATTGACTT TGATTTTGTC CTGCGCGGTG 180 
ATGGATAAAA TCGCCAGCGA TAAAGATTTG CGAGAACCTG ATGCCGGCCT GTTGTTGAAT 2 JO 

ATTTTCGACC TGTAATTACG ATTTGGCTTC CGCGCCGGCA CAATATGCCG CCAAGCGGCG 300 
CCCACATTTT GGAAGC 316 
(2) INFORMATIONS POUR LA SEQ ID NO: 99: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 217 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 
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(:<i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 99: 

AATTCGGACA GTATGAATAC AGCGGATTAA TACAAGGTAA GTTCATTACA ACGGAAAAAC 6 0 

CTTTAAAGAA TAATATGAAA GGTATTACCT TGTTTGCCAA CGGGAATGGT AAATATGCCC 120 

GAGTTTTTCA CTGAATAGCG AATCCAGCCA TTTCTATTCA TATTTGACTG GATGGCTGAA 180 

TGTGGACTTT ATAGATAATG ACGATGAAGA TTTAATT 217 
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REVENDICATIONS 
1/ ADN caracterises en ce qu'il s ' agit de tout 
ou partie de genes, avec leur phase de lecture, presents 
chez Neisseria meningitidis (designee ci-apres par Nm), 
mais absents soit chez Neisseria gonorrhoeae (designee 
ci-apres par Ng), soit chez Neisseria Pactamica (designee 
ci-apres par Nl) a 1' exception des genes impliques dans 
la biosynthese de la capsule polysaccharidique, frpA, 
frpC, opc, porA, rotamase, de la sequence IC1106, des IgA 
proteases, de la pilline, de pile, des proteines qui 
lient la transferrine et des proteines d'opacite.. 

2/ ADN selon la revendication 1, caracterises 
en ce qu'ils sont presents chez Nm, mais absents chez Ng. 

3/ ADN selon la revendication 2, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre tufA et pilT, ou region 1 du chromosome, et/ou la 
ou les sequence(s) nucleotidique( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 

4/ ADN selon la revendication 2, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre pilQ et i740, ou region 2 du chromosome, et/ou la 
ou les sequence(s) nucleotidique( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 

5/ ADN selon la revendication 2, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre argF et opaB, ou region 3 du chromosome, et/ou la 
ou les sequence(s) capable(s) de s'hybrider avec la ou 
lesdites sequences. 

6/ ADN selon la revendication 3, caracterises 
en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n* 9, 13, 22 ou 30, et/ou a toute sequence se 
situant a plus ou moins 20 kb de ces SEQ ID sur le 
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chromosome d'une souche de Nm, et/ou est capable de 
s ' hybrider avec au moins un fragment de 1 ' une quelconque 
de ces sequences. 

7/ ADN selon la revendication 4, caracterises 
5 en ce que leur sequence correspond pour, tout ou partie, 
a SEQ ID n* 1, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou, a 
toute sequence se situant a plus ou moins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 
capable de s ' hybrider avec au moins un fragment de 1 ' une 

10 quelconque de ces sequences. 

8/ ADN selon la revendication 4, caracterises 
en ce qu'il s ' agit de tout ou partie de la sequence d'ADN 
SEQ ID N*36 ou de sequences correspondant aux cadres 
ouverts de lecture SEQ ID N*37, SEQ ID N*38, SEQ ID N*39, 

15 SEQ ID N*40, SEQ ID N 4 41, SEQ ID N*42, SEQ ID N'43, SEQ 
ID N*44, SEQ ID N*45 et/ou a toute sequence se situant a 
plus ou moins 20 kb de ces SEQ ID sur le chromosome d'une 
souche de Nm, et/ou est capable de s' hybrider avec au 
moins un fragment de l'une quelconque de ces sequences. 

20 9/ ADN selon la revendication 5, caracterises 

en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n' 8, 21, 23, 25, 26, 28, 29, 32 ou 35, et/ou, a 
toute sequence se situant a plus ou moins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 

25 capable de s ' hybrider avec au moins un fragment de 1 ' une 
quelconque de ces sequences. 

10/ ADN selon la revendication 2, caracterises 
en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n* 3, 5, 11, 12, 14, 16, 18, 19, 20, 24, 27 ou 

30 33, et/ou a toute sequence se situant a plus ou moins 20 
kb de ces SEQ ID sur le chromosome d'une souche de Nm, 
et/ou, est capable de s' hybrider avec au moins un 
fragment de l'une quelconque de ces sequences. 
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11/ ADN selon la revendication I, caracterise 
en ce qu'ils sont communs avec ceux de Ng, mais sont 
absents de chez Nl. 

12/ ADN selon la revendication 11, caracterise 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre arg J et reg F, ou region 4 du chromosome et/ou la 
ou les sequence(s) nucleotique( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 

13/ ADN selon la revendication 11, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre le marqueur lambda 375 a pen A, ou region 5 du 
chromosome et/ou la ou les sequenced ) nucleotique( s ) 
capable(s) de s'hybrider avec la ou lesdites sequences. 

14/ ADN selon 1 ' une quelconque des 
revendications precedentes, caracterise en ce qu'il code 
pour une proteine exportee au-dela de la membrane 
cytoplasmique. 

15/ ADN selon 1 ' une quelconque des 
revendications 1 a 14, caracterises en ce que tout ou 
partie de leur sequence correspond a une region conservee 
au sein de l'espece Nm. 

16/ ADN selon l'une quelconque des 
revendications 1 a 15, caracterise en ce qu'il est insere 
dans un vecteur de transfert ou d' expression tel que 
cosmide, plasmide ou bacteriophage. 

17/ Cellule hote, plus particulierement cellule 
bacterienne ou cellule de Nm, transformee par 1' insertion 
d'au moins un ADN selon l'une quelconque des 
revendications 1 a 15. 

18 /Cellule comportant des genes ou des 
fragments de genes specif iques de Nm, plus 
particulierement cellule bacterienne, ou cellule de Nm, 
dont le chromosome est delete d'au moins un ADN selon 
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particulier d'un ADN responsable de la pathogenies te . 

19/ ARN, caracterises en ce que leur sequence 
correspond pour tout ou partie a la transcription d'au 
5 moins une sequence ou fragment de sequence d'ADN selon 
l'une quelconque des revendications 1 a 15. 

20/ Acides nucleiques anti-sens, caracterises 
en ce que leur sequence correspond a l'anti-sens d'au 
moins une sequence nucleotidique selon l'une quelconque 

10 des revendications 1 a 15 ou 19, ou d'un fragment d'une 
telle sequence, et qu'ils portent, le cas echeant, au 
moins une substitution chimique telle qu'un groupe 
methyle et/ou un groupe glycosyle. 

21/ Polypeptides, caracterises en ce qu'ils 

15 presentent un enchainement d' acides amines correspondant 
a tout ou partie d'une sequence telle que codee par les 
acides nucleiques definis dans l'une quelconque des 
revendications 1 a 15 ou 19, ou tel que deduit des 
sequences de ces acides nucleiques, avec, le cas echeant, 

20 des modifications par rapport aux sequences codees ou 
deduites des lors que ces modifications n'alterent pas 
les proprietes biochimiques telles qu'observees chez le 
polypeptide natif. 

22/ Peptides selon la revendication 21, 

25 caracterises en ce qu'il s'agit de peptides exportes au- 
dela de la membrane cytoplasmique, plus specialement de 
peptides correspondant a tout ou partie de ceux codes par 
un ADN selon la revendication 14. 

23/ Anticorps, caracterises en ce qu'il s'agit 

30 d ' anticorps polyclonaux ou monoclonaux diriges contre au 
moins un epitope d'un peptide selon la revendication 20 
ou 21, ou de fragments de ces anticorps, plus 
particulierement les fragments Fv, Fab, Fab' 2, ou encore 
d' anti-anticorps capables de reconnaitre, selon une 
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reaction de type antigene-anticorps, lesdits anticorps ou 
leurs fragments. 

24/ Procede d * ob tent ion de banques d'ADN 
Neisseria meningitidis -specif iques, comprenant : 

- le melange de deux populations d'ADN, 

la realisation d'au moins une iteration 
d ' hybridation-amplification soustractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas echeant de leur purification avec 
1 ' elimination des sequences redondantes. 

25/ Procede selon la revendication 24, 
caracterises en ce que pour obtenir une banque Nm 
specif ique par rapport a Ng 

- on melange deux populations d'ADN provenant 
respectivement d'une souche de Neisseria meningitidis, ou 
souche de reference, pour laquelle la banque specif ique 
doit etre constitute, et d'une souche de Neisseria 
gonorrhoeae, ou souche de soustraction, les sequences 
d'ADN de ces souches etant telles qu'obtenues par 

. cisaillement aleatoire de l'ADN chromosomique 
de la souche de soustraction, notamment par passages 
repetes a travers une seringue, et 

. clivage de l'ADN chromosomique de la souche 
de reference, de preference par une enzyme de restriction 
produisant des fragments de taille inferieure a lkb 
environ, et que pour obtenir une banque d'ADN communs 
entre Nm et Ng, mais specif iques par rapport a Nl, on 
constitue trois banques differentes, dont deux par 
digestion de l'ADN chromosomique de Nm par MBol et 
Tsp5091, et la troisieme, par digestion de l'ADN 
chromosomique de Nm avec Mspl, on opere deux series de 
soustraction et on recupere les ADN presentant la 
specif icite recherchee. 
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26/ Banques de clones d'ADN telles qu'obtenues 
par mise en oeuvre du procede selon la revendication 24 
ou 25. 

27/ Application du procede selon la 
5 revendication 24 pour l'obtention de banques d'ADN 
specif iques d'une cellule donnee ou d'un variant donne 
d'une meme espece de cellule, des lors qu ' il existe une 
autre espece ou un autre variant proche genomiquement , 
et exprimant des pouvoirs pathogenes differents, en 
10 particulier de banques d'ADN specif iques de cryptocoques , 
d 1 Haemophilus, de pneumocoques ou encore d ' Escherichia. 

28/ Methode de diagnostic d'une infection 
meningococcique, et plus particulierement de la meningite 
meningococcique, par mise en evidence de la presence de 
15 Neisseria meningitidis dans un echantillon biologique 
caracterisee en ce qu'elle comprend les etapes de : 

- mise en contact d'un echantillon biologique a 
analyser, avec un reactif elabore a partir d'au moins un 
acide nucleique tel que defini dans l'une des 

20 revendications 1 a 15, ou 19, le cas echeant sous forme 
de sonde nucleotidique, ou d' amorce, ou en variante a 
partir d ' au moins un anticorps , ou un fragment 
d' anticorps, tel que defini dans la revendication 23, 
dans des conditions permettant respectivement une 

25 hybridation ou une reaction de type antigene-anticorps, 
et 

revelation du produit de reaction 
eventuellement forme. 

29/ Methode de diagnostic d'une reaction 
30 immunitaire specif ique de 1' infection meningococcique, 
caracterisee en ce qu'elle comprend les etapes de : 

- mise en contact d'un echantillon biologique a 
analyser avec au moins un polypeptide selon l'une 
quelconque des revendications 21 ou 22 ou d'un anti- 

35 anticorps selon la revendication 23, ou d ' un fragment de 
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celui-ci, ces produits etant, le cas echeant, marques 
dans des conditions permettant la realisation d ' une 
reaction de type antigene-anticorps, et 

revelation du produit de reaction 
eventuellement forme. 

30/ Kits pour la mise en oeuvre d'une methode 
selon l'une quelconque des revendications 28 ou 29, 
caracterises en ce qu ' ils comportent : 

- au moins un reactif tel que defini dans la 
revendication 28 ou 29, a savoir de type acide nucleique, 
anticorps ou peptide, 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d * hybridation 
nucleotidique ou de la reaction immunologique visee, 
ainsi qu'une notice d 'utilisation. 

31/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a visee anti- 
meningococcique, et destinee a prevenir toute forme 
d" infection par Neisseria meningitidis, caracterisee en 
ce qu'elle comprend, en association avec un/des 
vehicule(s) physiologiquement acceptable ( s ) , une quantite 
efficace : 

- de peptide selon la revendication 21 ou 22, 

ou 

- d' anticorps ou de fragment d ' ant i -anticorps 
selon la revendication 23, 

ce materiel etant eventuellement conjugue, afin de 
renforcer son immunogenic! te, a une molecule porteuse 
telle que proteine de polyovirus, toxine tetanique, 
proteine issue de la region hypervariable d'une piline. 

32/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a visee anti- 
meningococ„ique, et destinee a prevenir toute forme 
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Figure 7 
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Figure 8A 
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Figure 8B 
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Figure 8C 
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Figure 9 
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Figure 10 
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Figure 1 1 
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